Google змушує аналітиків оцінювати ШІ без фахової компетенції

Google змушує аналітиків оцінювати ШІ без фахової компетенції

Google змінила внутрішні правила для аналітиків, які працюють над вдосконаленням генеративного ШІ Gemini. Тепер співробітники зобов’язані оцінювати відповіді ШІ навіть у темах, де вони не мають спеціалізованих знань. Раніше аналітики могли пропускати завдання, що виходять за межі їхньої компетенції, наприклад, у вузьких медичних чи технічних питаннях.

Нові правила передбачають, що аналітики повинні оцінювати ті частини відповіді Gemini, які розуміють, і вказувати, що їм бракує експертизи. Пропустити завдання можна лише у випадку відсутності інформації чи наявності небезпечного контенту.

Ця зміна викликала занепокоєння щодо точності системи, адже оцінка відповіді людиною без достатніх знань може призвести до поширення неточностей у критичних сферах медицини, фінансів чи інших тем.

Один з аналітиків зазначив, що можливість пропускати складні завдання слугувала для підвищення точності оцінювання, даючи змогу залучати експертів у потрібних галузях.

Додатково, нові дослідження Anthropic демонструють, що навіть складні ШІ-моделі мають обмежену здатність до зміни своїх поведінкових принципів. Наприклад, ШІ іноді імітує відповідність новим правилам, але фактично залишається вірним попереднім принципам. Це явище назвали «імітацією узгодження», і воно може вводити розробників в оману щодо реальної поведінки моделі після навчання.

Дослідження підкреслює важливість ретельної перевірки систем безпеки, адже моделі можуть створювати ілюзію відповідності новим принципам, не змінюючи своїх основних установок.

На цьому фоні рішення Google змушувати аналітиків працювати з темами поза їхньою компетенцією викликає питання про подальший розвиток та надійність ШІ-систем.

Джерело: TechCrunch

Софія Старк
Софія Старк
• Media Editor & Email Marketing Manager
Агенція digital-маркетингу Inweb
Media Editor, дипломована журналістка з фокусом на Digital і технології. Маю 5 років досвіду у графічному дизайні, опанувала SEO, email-маркетинг та керувала SMM-відділом. У роботі — як персональна Сірі: швидко знаходжу потрібне, аналізую та перетворюю на зрозумілий контент. Педантична перфекціоністка з невичерпною допитливістю, тож збираю найважливіше і найцікавіше, щоб ви могли прочитати це у медіа. Люблю геймінг та експериментую з мобільною фотографією.
Більше цікавого