Один день из жизни сисадмина – Admin-Day

Блог системного администратора об it индустрии и околокомпьютерных тем. Жизненный опыт и истории в статьях и заметках. Один день из жизни сисадмина

базы

Big data – история

Big dataБольшая часть данных, получаемых сегодня, обладает специфическими свойствами: они очень разнообразны, сложны и, как правило, плохо структурированы. Перед гравировкой на глиняной табличке или записью в бухгалтерскую книгу аналоговые данные – текстовые или числовые – были каким-то образом организованы таким образом, чтобы следующий пользователь знал, как их читать.

Аналогичным образом, сбор цифровых данных государственными учреждениями, корпорациями и неправительственными организациями, как правило, осуществляется по предварительному заказу.

Напротив, данные, генерируемые социальными сетями, входами на серверы, покупками через интернет, геолокационными системами или показаниями датчиков, плохо структурированы.

В 1997 году двое коллег из НАСА, Майкл Кокс и Дэвид Эллсворт, предложили называть этот тип данных большими данными (иногда этот термин переводится как гига-данные). Два года спустя аналитик Gartner Даг Лейни, наблюдая за проблемами своих клиентов с данными из различных источников, их структурой и разнообразием форматов, пришел к выводу, что большие данные характеризуются большим объемом, скоростью и разнообразием.

Продолжить чтение “Big data – история”

Пролистать наверх
Мы используем cookie-файлы для наилучшего представления нашего сайта. Продолжая использовать этот сайт, вы соглашаетесь с использованием cookie-файлов.
Принять