APPERCASE
vasb@nccrepnfr.eh +7 499 302-34-17

Dataocean AI приняла участие в создании открытого набора данных GigaSpeech 2: крупномасштабного...

Dataocean AI совместно с ведущими университетами разработала GigaSpeech 2 — обширный датасет для распознавания речи на низкоресурсных языках, содержащий 30,000 часов аудио.

Dataocean AI, в сотрудничестве с несколькими университетами и компаниями, анонсировала создание GigaSpeech 2 — многоязычного датасета для распознавания речи. Он включает 30,000 часов автоматически транскрибированного аудио на тайском, индонезийском и вьетнамском языках. После доработки, refined версия предлагает 10,000 часов тайского, 6,000 часов индонезийского и 6,000 часов вьетнамского аудио.

Процесс создания датасета полностью автоматизирован и включает в себя сбор данных, транскрипцию и уточнение. GigaSpeech 2 охватывает множество тематик, таких как бизнес, культура, технологии и спорт. Модели, обученные на этом датасете, показывают результаты, сопоставимые с коммерческими решениями.

Теперь GigaSpeech 2 доступен для скачивания, что открывает новые горизонты для исследований в области распознавания речи.

Эта новость создана искусственным интеллектом на основе открытых данных и предназначена исключительно для информирования. Администрация сайта не несёт ответственности за её содержание. Новости агрегируются из различных источников, включая недружественные России страны и их средства массовой информации. Социальные сети Facebook, Instagram и WhatsApp принадлежат корпорации Meta, которая в России признана экстремистской организацией.

Вебинар, посвященный использованию ИИ в железнодорожной отрасли, пройдет 14 октября 2025 года. Участники смогут узнать о том, как технологии помогают улучшить планирование, безопасность и эффективность в этой сфере.
Конгресс США сталкивается с трудностями в принятии федерального законодательства об искусственном интеллекте, так как администрация Трампа настаивает на создании единой регуляторной базы, которая бы заменила законы штатов.
Армия США разрабатывает собственный ИИ-чатбот по имени Виктор, который будет предоставлять важную информацию прямо на передовой, используя данные из более чем 500 военных источников.
Написать нам