Коротко про проєкт
Наш клієнт – американський стартап, який розробив IoT-рішення для систем опалення, вентиляції та кондиціювання (HVAC). Воно поєднує розумні пристрої для очищення обладнання з мобільним додатком та веб-платформою. Пристрої автоматично прочищають дренажні лінії кондиціонерів від бактерій і засмічень, забезпечуючи стабільну роботу систем. Мобільний та веб-застосунки дозволяють як приватним користувачам, так і бізнес-клієнтам легко встановлювати, контролювати й керувати обладнанням, а також замовляти й замінювати картриджі для очищення.
Розширюючи діяльність на B2B-ринку, клієнт зіштовхнувся з новим викликом. Професійні підрядники HVAC, які займаються монтажем і сервісом систем, часто працюють в умовах браку інформації: приїжджаючи на об’єкт, вони заздалегідь не знають, яке саме обладнання встановлене, які його гарантійні умови чи строк служби. Це ускладнює планування профілактичного обслуговування, підвищує витрати та може призводити до затримок.
Щоб вирішити цю проблему, клієнт запропонував реалізувати нову функцію: дати користувачам і сервісним фахівцям можливість під час налаштування пристрою сфотографувати етикетку обладнання HVAC. Платформа автоматично розпізнаватиме модель і витягуватиме ключові характеристики, гарантійну інформацію та дані для обслуговування. Завдяки цьому обслуговування HVAC-систем стало значно простішим.
Виклик
Розробка функції для ідентифікації обладнання HVAC виявилася далеко не простою задачею.
Обладнання HVAC постачається від понад 15 великих виробників та багатьох менших брендів, кожен з яких пропонує десятки моделей. Створювати загальну базу вручну виявилося нереально, тому ми обрали єдиний оптимальний шлях — використання штучного інтелекту.
Завдання полягало в тому, щоб розробити AI-рішення для ідентифікації бренду та моделі кондиціонера, яке могло б:
- Приймати фото етикеток HVAC, завантажені користувачем.
- Визначати бренд і модель обладнання на початковому етапі.
- Витягувати широкий набір технічних і сервісних даних, зокрема:
- Бренд
- Модель
- Серійний номер
- Номер обладнання
- Дату виробництва
- Потужність у тоннах
- Електричні характеристики
- Потужність двигуна (HP)
- Рівень енергоефективності (SEER)
- Статус гарантії та дату її закінчення
- Конфігурацію фільтра та рекомендований розмір
Наша мета полягала в тому, щоб отримувати якомога більше корисних даних з кожного фото. Щоб досягти цього при оптимальних витратах, ми вирішили розробити алгоритм, який витягує всі необхідні дані та суттєво зменшує витрати на їх аналіз.
Рішення
Щоб подолати ці виклики та досягти поставлених цілей, ми розробили багаторівневий алгоритм розпізнавання етикеток на базі штучного інтелекту. Ось як він працює:
- Завантаження фото. Кінцеві користувачі завантажують фото етикетки обладнання через мобільний або веб-додаток.
- Підготовка. Сервер формує завдання для обробки фото та надсилає його в чергу Google Cloud Tasks для подальшої обробки.
- Асинхронне виконання. Запити обробляються по черзі, що забезпечує стабільну роботу системи та оптимальне використання ресурсів.
- Початковий аналіз. Система використовує великий мовний модуль (LLM) для первинного AI-аналізу фото для B2B підрядників HVAC. LLM витягує ключові дані, такі як бренд, модель, серійний номер тощо.
- Повернення опису. Система повертає опис із витягнутими даними з фото.
- Подальший аналіз. Отриманий опис перевіряється на наявність необхідних даних, передусім назви бренду та моделі.
- Якщо модель кондиціонера вже була оброблена, система використовує дані з кешу, замість повторного аналізу фото. Це пришвидшує розпізнавання та знижує витрати для раніше ідентифікованих моделей.
- Якщо модель нова, система додає дані через Vertex AI, використовуючи нашу бібліотеку інструкцій, PDF та фото, або перевіряє їх через Google Search.
- Уточнення даних. Система повертає JSON-файл з усіма необхідними даними, або принаймні з найбільш критичними.
- Нормалізація даних. Система очищає, стандартизує та перевіряє всі дані перед збереженням у базі.
- Фільтрація некоректних чи дублікатних фото (наприклад, фото нашого власного пристрою).
- Стандартизація назв виробників.
- Визначення дати виготовлення. Дата визначається або з етикетки, або декодуванням серійного номера за правилами конкретного бренду (наприклад, система серійних кодів Trane).
- Статус гарантії та розрахунок орієнтовної дати закінчення. Виконується навіть якщо дата виготовлення не вказана.
- Збереження даних. Всі структуровані метадані HVAC зберігаються в базі даних IoT-платформи для моніторингу HVAC.
Результат
Рішення для розпізнавання етикеток HVAC на базі штучного інтелекту успішно трансформувало бізнес нашого клієнта.
- Для B2B підрядників воно надає миттєву, практичну інформацію про HVAC-системи ще до приїзду на об’єкт.
- Для кінцевих користувачів забезпечує прозорість щодо їх обладнання, включно зі статусом гарантії та рекомендаціями щодо обслуговування.
- Для нашого клієнта відкриває новий джерело доходу, забезпечує конкурентну перевагу та оптимізацію витрат.
У нашій системі розпізнавання номерів моделей вентиляційного блока ми ретельно поєднуємо точність і економічність завдяки багаторівневій стратегії. Залежно від ситуації обирається один із трьох “режимів”, кожен із яких має свій баланс між швидкістю, вартістю та надійністю:
- Cache Retrieval (вартість: $0.093 – $0.279 за 1 тис. запитів)
- Це найдешевший варіант. Ми зберігаємо кеш (швидку таблицю пошуку) раніше розпізнаних моделей.
- Якщо вхідний запит збігається з уже збереженим, ми одразу повертаємо результат без запуску складніших AI або пошукових сервісів.
- Оскільки цей режим не потребує витратних обчислень чи пошуку, він є надзвичайно швидким і дешевим.
- Vertex AI Grounding (вартість: $2.593 – $7.779 за 1 тис. запитів)
- Якщо потрібної відповіді немає в кеші, ми “прив’язуємо” (ground) запит через Vertex AI (керовану AI-платформу Google) та нашу внутрішню базу знань.
- “Grounding” означає: ми витягуємо релевантні документи або факти з внутрішньої бази (чи векторного індексу) й передаємо їх як контекст великій мовній моделі (LLM), щоб вона приймала більш точні рішення.
- Такий підхід забезпечує вищу точність, ніж лише кеш, але значно дешевший, ніж повноцінний зовнішній пошук.
- Vertex AI підтримує цей механізм через retrieval-augmented generation (RAG) або подібні рішення.
- Google Search Grounding (вартість: $35.093 – $105.279 за 1 тис. запитів)
- Це “резервний”, найдорожчий варіант, який застосовується, коли ні кеш, ні внутрішні знання не дають впевненої відповіді.
- У цьому режимі ми виконуємо живий пошук у Google, отримуємо відповідні вебсторінки та зовнішні дані, після чого передаємо їх LLM для формування відповіді.
- Оскільки вебпошук дорожчий і повільніший, цей режим має найвищу вартість.
- За політиками Google, орієнтовна ціна — близько $35 за 1 тис. пошукових запитів (~$0.035 за один).
Навіщо три рівні? (і коли кожен застосовується)
-
Затримка: Кеш — майже миттєвий, зовнішній пошук займає більше часу.
-
Вартість: Ми уникаємо вебпошуку, якщо це можливо, і звертаємося до нього лише за потреби.
-
Точність / покриття: Внутрішня база знань (через Vertex AI) покриває більшість звичайних випадків, а Google Search допомагає з рідкісними чи новими моделями.
-
Масштабованість: Багаторівнева архітектура дозволяє економно масштабувати систему — типові запити обробляються дешево, а складні — вибірково, з вищою ціною.
Пояснення ключових термінів:
-
Cache — набір заздалегідь збережених результатів, які можна повторно використати без повторного обчислення.
-
Grounding — надання LLM зовнішнього контексту або фактів, щоб її відповіді базувались на реальних даних, а не на “галюцинаціях”.
-
Vertex AI — керована платформа Google Cloud для роботи з AI/ML, яка підтримує моделі, індексацію, embeddings і “grounding”.
-
Google Search Grounding — використання живого вебпошуку (через API Google) як джерела зовнішнього контексту, коли внутрішніх знань недостатньо.
Підсумок
Наша система розпізнавання моделей вентиляційних блоків поєднує точність і ефективність за допомогою триступеневої стратегії.
Для запитів, що вже є в кеші, ми використовуємо Cache Retrieval ($0.093–$0.279 / 1k запитів).
Якщо не знайдено — застосовуємо Vertex AI Grounding із внутрішньою базою ($2.593–$7.779 / 1k).
Лише у складних випадках підключаємо Google Search Grounding ($35.093–$105.279 / 1k).
Такий підхід забезпечує високу точність, коли це потрібно, але мінімізує витрати у звичайних сценаріях — для стабільної, масштабованої роботи системи.

