• 27 Лютого 2025

ElevenLabs представила Scribe — власну модель ШІ для перетворення аудіо в текст

Стартап ElevenLabs представив свою першу автономну модель перетворення мовлення в текст — Scribe. Досі компанія пропонувала такі послуги через партнерські рішення, але тепер виходить на ринок самостійно, і буде конкурувати з OpenAI Whisper, Speechmatics, Deepgram та іншими сервісами розпізнавання мовлення.

Scribe підтримує розпізнавання 99 мов, зокрема англійської, французької, німецької, іспанської, португальської, японської та інших. Для 25 мов похибка не перевищує 5%, що ставить модель у категорію з «високою точністю». У тестах FLEURS і Common Voice Scribe перевершила Google Gemini 2.0 Flash і Whisper Large V3 за рівнем коректності транскрипції.

Модель може автоматично визначати, хто саме говорить у діалозі, додає мітки часу до кожного слова та розпізнає звукові події, як-от сміх чи аплодисменти. ElevenLabs інтегрувала Scribe у власну платформу, що дозволяє транскрибувати відео для створення субтитрів або текстових розшифровок.

Наразі Scribe працює лише з попередньо записаними аудіофайлами, однак компанія вже розробляє версію для розпізнавання мовлення в реальному часі, що дозволить використовувати модель для стенографування зустрічей або автоматичного запису голосових нотаток.

Вартість транскрипції — $0.40 за годину аудіо. Це конкурентна пропозиція, хоча деякі аналоги на ринку пропонують нижчі ціни та додаткові функції.

Джерело: TechCrunch

Ринки

Софія Старк

• Content & Email Strategist

Агенція digital-маркетингу Inweb

Media Editor, дипломована журналістка з фокусом на Digital і технології. Маю 5 років досвіду у графічному дизайні, опанувала SEO, email-маркетинг та керувала SMM-відділом. У роботі — як персональна Сірі: швидко знаходжу потрібне, аналізую та перетворюю на зрозумілий контент. Педантична перфекціоністка з невичерпною допитливістю, тож збираю найважливіше і найцікавіше, щоб ви могли прочитати це у медіа. Люблю геймінг та експериментую з мобільною фотографією.

Більше цікавого

Новини

Дослідження: багатоканальний маркетинг у 2024 році залишається викликом для маркетологів 7 Серпня 2024

Новини

OpenAI повернула вибір ШІ-моделей у ChatGPT, але він став складнішим 13 Серпня 2025

Новини

Gemini у Google Forms тепер може автоматично підсумовувати відповіді користувачів 11 Червня 2025

Новини

LinkedIn представив ШІ-інструменти для пошуку роботи та найму персоналу 16 Січня 2025

Новини

Anthropic оскаржить у суді рішення Пентагону про ризик ланцюга постачання 6 Березня 2026

Новини

Українці рідше відвідують заклади, але витрачають більше — Опендатабот 12 Листопада 2025