Водні катування - Аналогія аналітики заходить занадто далеко

крапельна аналітика

Дані, як і вода, надходять у багатьох формах. Людський розум еволюціонував, щоб відфільтрувати більшість даних, які потрапляють на наш шлях, тому що їх просто так багато.

Коли ви відкриваєте очі та вуха, дані є скрізь. Колір стіни, звук кондиціонера та запах кави вашого сусіда сприймаються як вологість. Вода весь час у повітрі, але не корисно приділяти їй велику увагу.

Коли вода конденсується в туман, це змушує вас це бачити і ускладнює розуміння навколишнього світу. Неповні набори даних, пошкоджені дані, погана наука, хибні висновки та когнітивні упередження - все це змушує вас заблукати в тумані.

Дані падають як дощ. Коли є лише трохи, це дико не задовольняє - достатньо, щоб забруднити машину та заплутати розмову. Ви виявляєте, що витираєте пляму на своїх окулярах, коли хтось видає якусь випадкову точку даних, витягнуту з якогось незрозумілого джерела.

  • Несвіжа вода в неглибокому ставку небезпечно. Дані, зібрані з ненадійного запасу, ні очищені, ні нормалізовані та залишені у стагнації, можуть легко призвести до хибних висновків.
  • A стійка цівка води може бути достатньо для заповнення їдальні або підтримання лісової екосистеми. Лише три точки даних (кількість надісланих електронних листів проти відкритих та натиснутих) можуть підтримувати маркетингову програму.
  • A здоровіший потік даних у вигляді невеликого струмка можна використовувати для купання. Безперервний потік даних дозволяє проводити порівняльний аналіз та історичне порівняння. Оптимізація цільової сторінки може бути здійснена за допомогою постійних даних про перетворення.
    A скромна річка може живити млин для розпилювання деревини або подрібнення пшениці. Система рекомендацій потребує лише надійного внеску з боку декількох приток, щоб забезпечити збільшення вартості кошиків для покупок.
  • A водоспад може рухати величезне водяне колесо, а достатній приплив інформації може приводити в дію систему динамічного змісту.
  • A річка це досить широке і глибоке може підтримати цілу транспортну галузь. Достатньо даних може плавати на баржах і вантажних суднах у формі набору файлів cookie з рекламних мереж, агрегаторів даних програм лояльності та посередників даних.

Коли дані надходять у очікуваних обсягах у передбачуваний час, їх можна захопити, направити та використати. Зрошувальні системи, дамби та водосховища створюють відчуття контролю та дозволяють будувати дедалі ширшу інфраструктуру з каналами, шлюзами та дамбами. Сховища даних побудовані на менш надійних потоках.

Чистота поруч із благочестям

Чиста вода життєво необхідна для успіху життя, зрошення, роботи електростанцій тощо. Визначення поняття "чиста" може змінитися з ціллю; Це нормально, якщо у воді є водорості, які охолоджують електростанцію, і це неприйнятно, якщо в питній воді більше 10 частин на мільярд миш’яку.

Дані однакові. У заявці на пряму пошту, чи маєте ви титул особи (пан, пані, пані), не має значення… якщо ви не надсилаєте поштою лікарям. Але брудні дані щоразу збиватимуть вас.

Як головний науковий співробітник США, Діджей Патіл, висловіть це на саміті технічного керівника першого туру: «Якщо ви не думаєте про те, як зберегти ваші дані в чистоті з самого початку, ви знайомі. Я це гарантую. Спроба прибрати це після факту займе щонайменше місяці ".

Якщо нагріти воду до температури кипіння, вона може забезпечити цілу Промислову революцію. Схоже, дані роблять те саме. З того моменту, коли комп’ютери могли зберігати, а також обчислювати, дані збиралися так швидко, наскільки для цього було створено обладнання для зберігання.

Озеро даних

Оскільки дані цих приток просочуються через двигуни млинів, все це опиняється в озері, за дамбою. Оскільки дані випускаються контрольовано, вони керують турбінами галузі обробки даних; ці гігантські двигуни обробки даних з іменами, такими як Google і Facebook. Тут посухи не буде.

І, нарешті, є глибока водойма, яка чекає, поки аналітик зануриться. Підводне спорядження та пістолет-рушниця в руці, аналітик досліджує глибину, картографує нові землі та відкриває нові види. Це дуже захоплюючий час бути дослідником даних.

Ось чому так багато з них з'являлися для Саміт eMetrics з 2002 р. Наступна можливість - у Бостоні, 27 вересня - 1 жовтня 2015 р.

Реєстрація на саміті eMetrics

Міст занадто далеко

А що з сили даних, щоб вирізати наступний Гранд-Каньйон? А як щодо льодовикового танення структурованих даних? Як ми поводимося зі стічними водами у світі, який стає дедалі більше привабливим?

Це питання на інший час і вода під мостом.

Що ви думаєте?

Цей сайт використовує Akismet для зменшення спаму. Дізнайтеся, як обробляються ваші дані коментарів.