DeepSeek знижує вартість роботи штучного інтелекту вдвічі завдяки моделі V3.2-exp

DeepSeek знижує вартість роботи штучного інтелекту вдвічі завдяки моделі V3.2-exp

Дослідники з DeepSeek представили експериментальну модель V3.2-exp, розроблену для суттєвого зниження операційних витрат під час роботи з великими обсягами даних. Про оголошення моделі та пов’язане з нею дослідження повідомлено на платформах Hugging Face та GitHub.

Ключова особливість цієї розробки — система «Розріджена увага» (DeepSeek Sparse Attention). Вона використовує механізм, що визначає пріоритетні фрагменти інформації у загальному контексті. Після цього інша система відбирає конкретні частини даних лише з цих фрагментів для обмеженого вікна уваги моделі. 

Це дозволяє моделям працювати з великими текстами, використовуючи при цьому значно менше серверних потужностей.

Переваги цього підходу є значними. Попереднє тестування DeepSeek показало, що вартість простого запиту до програмного інтерфейсу може бути зменшена майже вдвічі в ситуаціях, які вимагають роботи з великим контекстом.

Новий підхід DeepSeek має пряме економічне значення для всіх, хто використовує великі мовні моделі (ШІ) у своїй роботі.

Аналіз великих обсягів даних — наприклад, розшифровка довгих вебінарів, опрацювання великої кількості відгуків клієнтів або глибокий аналіз трендів — стане дешевшим і швидшим. Зниження операційних витрат на 50% робить використання ШІ-інструментів для складних завдань доступним не лише для великих корпорацій, але й для малого та середнього бізнесу, підвищуючи їхню конкурентоспроможність.

Для галузі в цілому це свідчить про зміну фокуса: увага зміщується з нарощування гігантських моделей на підвищення їхньої ефективності. Це демонструє, що існують практичні шляхи оптимізації базової архітектури, що може призвести до загального здешевлення обчислень. Таким чином, DeepSeek пропонує важливий урок щодо того, як керувати серверними витратами, роблячи потужний ШІ більш економічно виправданим і, відповідно, ширше застосовуваним у різних сферах.

Джерело: Tech Crunch

Гнатюк Дмитро
Гнатюк Дмитро
• News Editor
Inweb
Працюю з текстами так, щоб складне ставало простим і зрозумілим. Швидко знаходжу потрібну інформацію, аналізую та перетворюю її на змістовний контент. Люблю структуру й чіткість, але залишаю місце для експериментів. Цікавлюся музикою, технологіями та культурою, шукаю способи подати їх так, щоб зачепити читача.
Більше цікавого