37 thousand creatives in 5 minutes
Entrant: iProspect Ukraine
Country: Ukraine
Section/Contest/Category: C. AdTech AND TECHNOLOGY TOOLS / C03. AdTech Innovation
Award: Gold
Advertiser/Brand: OLX
Year: 2024
Creative Team:
Нікіта Васянович, Data researcher, iProspect Оксана Марусич, Strategy Director, iProspect Тетяна Дорошенко, Researcher, iProspect Ірина Балашова, СЕО, iProspect
Creative idea:
Проблема Для створення ефективної медійної стратегії (визначення оптимального медіа-тиску та формування cost-effective спліту) необхідно чітко розуміти витрати конкурентів на рекламу в різних форматах. Це завдання стає значно складнішим для великих брендів, які охоплюють кілька категорій продуктів чи послуг (п'ять і більше), оскільки кожна категорія має свій пул конкурентів, що генерують тисячі, а іноді й сотні тисяч креативів. В таких умовах критично важливо не лише знати загальні рекламні бюджети конкурентів, але й детально розуміти, скільки саме вони витрачають на кожну окрему категорію чи продукт. Виклик База даних Excel, яку ми зібрали для аналізу всіх категорій OLX містив 37 530 рядків із загальною інформацією по кожному ID номеру креативу. Уявіть: якщо витрачати хоча б 11 секунд на перегляд одного зображення та сортування його до певної категорії вручну, а відео – ще довше, це зайняло б понад 17 годин безперервної роботи. Додайте сюди людський фактор: втому, помилки, необхідність перерв та перевірок. У реальних умовах цей процес міг би зайняти кілька днів чи навіть тиждень. А OLX потрібні були ці дані швидко та без помилок, оскільки від цього залежала якість майбутньої медіа-стратегії. Ідея Після того, як декілька спеціалістів витратили (читайте — проклікали) перші три дні на сортування креативів вручну, терпець data-відділу увірвався і було прийнято рішення автоматизувати цей процес завдяки власноруч написаній програмі на Python. Як це працювало? Користувачу на екрані послідовно відкривався файл кожного креативу. Фахівцю лишалось натиснути кнопку на діалоговому вікні з відповідною категорією. Програма самостійно знаходила потрібний креатив у теці з вивантаженнями та оновлювала його. Завдяки цьому перегляд одного креативу скоротився з 11 до 2 секунд. Але, як кажуть, “лінь — джерело прогресу”. Сортувати матеріали в такий спосіб було все ще доволі нудно, тому команда почала думати, а чи немає якогось рішення АІ, яке б могло замість людини розпізнавати креативи. Так виникла ідея замінити ручну роботу інтеграцією Python з Google Cloud Vision API, який міг автоматично аналізувати зображення без попереднього навчання моделі. Інновація Інноваційним рішенням стало об’єднання AI-аналізу контенту із технологією розрахунку бюджету кожного креативу. Це дозволило клієнту миттєво отримувати детальну аналітику: не лише бачити формати й бюджети конкурентів, але й точно знати, які продукти вони просувають, витративши на це лише кілька хвилин замість днів ручної роботи. Реалізація Проєкт складався з кількох ключових етапів: 1. Отримання даних: на базі моніторингових даних агенція створювала базу креативів з естимованими бюджетами та показами. 2. Розробка алгоритму аналізу: ми використали Python для автоматичного аналізу зображень на основі Google Cloud Vision API. На даному етапі була застосована інтеграція моделей Optical Character Recognition, Object Detection та Web Detection. 3. Удосконалення категоризації: ми застосували алгоритм підрахунку частоти ключових слів для уникнення помилкової класифікації. Наприклад, якщо в оголошенні про роботу є зображення автомобіля, наша система не віднесе його до категорії "реклама авто". Завдяки розпізнаванню тексту та додаткових елементів (таких як люди у робочому одязі, специфічні терміни та аналіз зображень у мережі). Це дозволяє точніше визначити, що основний зміст оголошення – працевлаштування, а не продаж авто. 4. Автоматизація звітності: для юзер-френдлі використання нашого рішення ми створили програму, яка записує сегментацію в Excel-документ з назвами креативів, бюджетами, показами та категоризацією. Результати На виході ми отримали детальний файл з усією необхідною інформацією по бюджетах, форматам та показам конкурентів. Час аналізу скоротився з декількох днів до 5 хвилин, а якість сегментації значно покращилася завдяки AI. Це дозволило нам миттєво отримати аналітику, що раніше була б доступною лише після тривалих і трудомістких досліджень. Окрім цього ми зменшили прямі витрати департаменту ресьорчу, а розроблене рішення дозволило не просто заощадити час, а й надати OLX детальне порівняння витрат у динаміці на кожну категорію, відносно інших брендів, що розміщуються у цій ніші. А відтак, побудувати ефективну медіастратегію. ENG 37 THOUSAND CREATIVES IN 5 MINUTES: OLX CASE STUDY The problem To create an effective media strategy (determining the optimal media pressure and forming a cost-effective split), it is necessary to clearly understand competitors' advertising costs in various formats. This task becomes much more complicated for large brands that cover several product or service categories (five or more), as each category has its own pool of competitors generating thousands, and sometimes hundreds of thousands of creatives. In such circumstances, it is critical not only to know the total advertising budgets of competitors, but also to understand in detail how much they spend on each individual category or product. Challenge The Excel database we collected to analyse all OLX categories contained 37,530 rows with general information about each creative ID number. Imagine: if we spent at least 11 seconds manually reviewing each image and sorting it into a category, and even longer for videos, it would take more than 17 hours of continuous work. Add to this the human factor: fatigue, mistakes, the need for breaks and checks. In real life, this process could take several days or even a week. OLX needed this data quickly and without errors, as the quality of its future media strategy depended on it. The idea After several specialists spent the first three days sorting creatives manually, the data department's patience broke down and it was decided to automate this process using a self-written Python program. How did it work? The user was presented with a file of each creative on the screen. The specialist had to click the button on the dialogue box with the appropriate category. The program would find the required creative in the uploads folder and update it. As a result, the time to view one creative was reduced from 11 to 2 seconds. But as they say, ‘laziness is the source of progress’. Sorting materials in this way was still quite tedious, so the team started thinking about whether there was any AI solution that could recognize creatives instead of humans. That's how they came up with the idea of replacing manual work with Python integration with the Google Cloud Vision API, which could automatically analyze images without first training a model. Innovation An innovative solution was the combination of AI content analysis with the technology for calculating the budget of each creative. This allowed the client to instantly receive detailed analytics: not only to see the formats and budgets of competitors, but also to know exactly what products they were promoting, spending just a few minutes instead of days of manual work. Implementation The project consisted of several key stages: 1. Data acquisition: based on the monitoring data, the agency created a database of creatives with estimated budgets and impressions. 2. Development of an analysis algorithm: we used Python to automatically analyze images based on the Google Cloud Vision API. At this stage, we integrated Optical Character Recognition, Object Detection, and Web Detection models. 3. Improved categorization: we applied a keyword frequency calculation algorithm to avoid misclassification. For example, if a job advert contains a picture of a car, our system will not classify it as a car advert. It recognizes text and additional elements (such as people in work clothes, specific terms, and analyses images on the web). This allows us to determine more accurately that the main content of the ad is employment, not car sales. 4. Reporting automation: for the user-friendliness of our solution, we have created a program that records segmentation in an Excel document with creative names, budgets, impressions, and categorization. Results As a result, we received a detailed file with all the necessary information on budgets, formats, and competitors' impressions. The analysis time was reduced from several days to 5 minutes, and the quality of segmentation was significantly improved thanks to AI. This allowed us to instantly get analytics that would have been available only after long and labour-intensive research. In addition, we reduced the direct costs of the research department, and the developed solution allowed us not only to save time, but also to provide OLX with a detailed comparison of the costs in the dynamics of each category, relative to other brands in this niche. And thus, to build an effective media strategy.