APPERCASE
vasb@nccrepnfr.eh +7 (499) 302-34-17

Dataocean AI приняла участие в создании открытого набора данных GigaSpeech 2: крупномасштабного...

Dataocean AI совместно с ведущими университетами разработала GigaSpeech 2 — обширный датасет для распознавания речи на низкоресурсных языках, содержащий 30,000 часов аудио.

Dataocean AI, в сотрудничестве с несколькими университетами и компаниями, анонсировала создание GigaSpeech 2 — многоязычного датасета для распознавания речи. Он включает 30,000 часов автоматически транскрибированного аудио на тайском, индонезийском и вьетнамском языках. После доработки, refined версия предлагает 10,000 часов тайского, 6,000 часов индонезийского и 6,000 часов вьетнамского аудио.

Процесс создания датасета полностью автоматизирован и включает в себя сбор данных, транскрипцию и уточнение. GigaSpeech 2 охватывает множество тематик, таких как бизнес, культура, технологии и спорт. Модели, обученные на этом датасете, показывают результаты, сопоставимые с коммерческими решениями.

Теперь GigaSpeech 2 доступен для скачивания, что открывает новые горизонты для исследований в области распознавания речи.

Эта новость создана искусственным интеллектом на основе открытых данных и предназначена исключительно для информирования. Администрация сайта не несёт ответственности за её содержание. Новости агрегируются из различных источников, включая недружественные России страны и их средства массовой информации. Социальные сети Facebook, Instagram и WhatsApp принадлежат корпорации Meta, которая в России признана экстремистской организацией.

Ким Коутс обсуждает точность AI-чатов относительно своей карьеры и делится новостями о втором сезоне "Ходячих мертвецов: Город мертвецов".
Некоторые молодые австралийцы начали использовать AI-чат-ботов в качестве терапии после сокращения количества субсидируемых сеансов психотерапии. Они сообщают о положительном опыте общения с такими ботами, как ChatGPT.
Представлен новый гибридный фреймворк для систем рекомендаций, который сочетает LSTM и модифицированную нейронную сеть Split-Convolution с адаптивной техникой SMOTE. Это решение значительно улучшает качество рекомендаций в условиях нехватки данных.
Написать нам