Дедуплікація: найкращі практики уникнення або виправлення дублікатів даних клієнтів

Найкращі практики дедуплікації даних для CRM

Повторювані дані не тільки знижують точність ділової статистики, але й погіршують якість взаємодії з клієнтами. Хоча з наслідками дублікатів даних стикаються всі - ІТ-менеджери, бізнес-користувачі, аналітики даних, - це найгірше впливає на маркетингові операції компанії. Оскільки маркетологи представляють пропоновані компанією товари та послуги в галузі, погані дані можуть швидко зіпсувати репутацію вашого бренду та призвести до негативного досвіду клієнтів. Повторювані дані в CRM компанії трапляються з ряду причин.

Від людської помилки до замовників, які надають дещо іншу інформацію в різні моменти часу в базі даних організації. Наприклад, споживач перераховує своє ім’я як Джонатан Сміт на одній формі та Джон Сміт на іншій. Проблема посилюється завдяки зростанню бази даних. Адміністраторам часто стає важче відстежувати БД, а також відстежувати відповідні дані. Дедалі складнішим стає забезпечення того, щоб БД організації залишався точним ”.

Натік Амін, експерт з маркетингу в Canz маркетинг

У цій статті ми розглянемо різні типи дублікатів даних та деякі корисні стратегії, які маркетологи можуть використовувати для дедупіювання баз даних своїх компаній.

Різні типи повторюваних даних

Дублікати даних зазвичай пояснюються як копія оригіналу. Але існують різні типи дублікатів даних, які додають складності цій проблемі.

  1. Точні дублікати в одному джерелі - Це трапляється, коли записи з одного джерела даних переносяться в інше джерело даних, не розглядаючи жодних методів узгодження або об’єднання. Прикладом може бути копіювання інформації з CRM на інструмент маркетингу електронною поштою. Якщо ваш клієнт підписався на ваш інформаційний бюлетень, то його запис уже присутній в інструменті маркетингу електронної пошти, і передача даних із CRM до інструменту створить копії тієї самої сутності. 
  2. Точні копії у кількох джерелах - Точні копії в кількох джерелах, як правило, виникають завдяки ініціативам щодо резервного копіювання даних у компанії. Організації, як правило, чинять опір видаленню даних і схильні зберігати всі копії даних, які є в їх наявності. Це призводить до різного роду джерел, що містять повторювану інформацію.
  3. Змінюються дублікати в кількох джерелах - Дублікати можуть існувати з різною інформацією. Зазвичай це відбувається, коли клієнти змінюють прізвище, назву посади, компанію, адресу електронної пошти тощо. А оскільки між старими та новими записами є помітні відмінності, вхідна інформація розглядається як нова сутність.
  4. Неточні дублікати в одному або кількох джерелах - Неточний дублікат - це коли значення даних означає одне і те ж, але воно представляється по-різному. Наприклад, ім'я Дона Джейн Рут може бути збережено як Дона Дж. Рут або DJ Ruth. Всі значення даних представляють одне і те ж, але якщо порівнювати їх за допомогою простих методів узгодження даних, вони вважаються невідповідними.

Дедуплікація може бути дуже складним процесом, оскільки споживачі та компанії часто змінюють свої контактні дані з часом. Існує різниця в тому, як вони вводять кожне поле даних - від свого імені, електронної адреси (адрес), адреси проживання, адреси бізнесу тощо.

Ось список з 5 найкращих практик дедуплікації даних, які маркетологи можуть почати використовувати сьогодні.

Стратегія 1: Забезпечте перевірку при введенні даних

Ви повинні мати строгий контроль перевірки на всіх сайтах введення даних. Це передбачає забезпечення відповідності вхідних даних необхідному типу даних, формату та розміщення між допустимими діапазонами. Це може значно допомогти зробити ваші дані повними, дійсними та точними. Крім того, дуже важливо, щоб робочий процес введення даних був налаштований не тільки на створення нових записів, але спочатку здійснював пошук та знаходження, якщо набір даних містить існуючий запис, який відповідає вхідному. І в таких випадках він лише знаходить і оновлює, а не створює новий запис. Багато компаній включили чеки для замовника для вирішення власних дублікатів даних.

Стратегія 2: Виконайте дедуплікацію за допомогою автоматизованих інструментів

Скористайтеся послугою самообслуговування програмне забезпечення для дедуплікації даних які можуть допомогти вам у виявленні та очищенні дубльованих записів. Ці інструменти можуть стандартизувати дані, точно знаходять точні та неточні збіги, а також вони скорочують ручну працю при перегляді тисяч рядків даних. Переконайтесь, що інструмент пропонує підтримку імпорту даних із найрізноманітніших джерел, таких як аркуші Excel, база даних CRM, списки тощо.

Стратегія 3: Використовуйте специфічні для даних методи дедуплікації

Залежно від характеру даних дедуплікація даних здійснюється по-різному. Маркетологи повинні бути обережними під час виведення даних, оскільки одне і те ж може означати щось різне в різних атрибутах даних. Наприклад, якщо два записи даних збігаються на електронній адресі, то існує велика ймовірність того, що вони є дублікатами. Але якщо два записи співпадають за адресою, це не обов’язково дублікат, оскільки дві особи, що належать до одного домогосподарства, можуть мати окремі підписки у вашій компанії. Тож обов’язково виконуйте дії з дедуплікації, злиття та очищення даних відповідно до типу даних, що містяться у ваших наборах даних.

Стратегія 4: досягнення золотого рекорду шляхом збагачення даних

Після того, як ви визначили список відповідностей, які існують у вашій базі даних, дуже важливо проаналізувати цю інформацію, перш ніж приймати рішення щодо злиття чи очищення даних. Якщо для однієї сутності існує кілька записів, а деякі представляють неточну інформацію, тоді найкраще очистити ці записи. З іншого боку, якщо дублікати неповні, то злиття даних є кращим вибором, оскільки це дозволить збагатити дані, а об’єднані записи можуть додати більшої цінності вашому бізнесу. 

У будь-якому випадку, маркетологи повинні працювати над досягненням єдиного погляду на свою маркетингову інформацію, який називається золотий головний запис.

Стратегія 5: Моніторинг показників якості даних

Постійні зусилля, щоб зберегти ваші дані чистими та дедупірованими, є найкращим способом реалізації вашої стратегії дедуплікації даних. Тут може бути дуже корисний інструмент, що пропонує функції профілювання даних та управління якістю. Для маркетологів надзвичайно важливо стежити за тим, наскільки точними, достовірними, повними, унікальними та послідовними є дані, які використовуються для маркетингових операцій.

Оскільки організації продовжують додавати додатки даних до своїх бізнес-процесів, кожному маркетологу стало необхідним мати стратегії дедуплікації даних. Такі ініціативи, як використання інструментів дедуплікації даних та розробка кращих робочих процесів перевірки для створення та оновлення записів даних, є одними з найважливіших стратегій, які можуть забезпечити надійну якість даних у вашій організації.

Про сходи даних

Data Ladder - це платформа управління якістю даних, яка допомагає компаніям в очищенні, категоризації, стандартизації, дедуплікації, профілюванні та збагаченні своїх даних. Наше провідне в галузі програмне забезпечення для зіставлення даних допомагає знаходити відповідні записи, об’єднувати дані та видаляти дублікати за допомогою інтелектуальних нечітких алгоритмів відповідності та машинного навчання, незалежно від того, де ваші дані живуть і в якому форматі.

Завантажте безкоштовну пробну версію відповідного програмного забезпечення Data Ladder

Що ви думаєте?

Цей сайт використовує Akismet для зменшення спаму. Дізнайтеся, як обробляються ваші дані коментарів.