Google продолжает расширять свои усилия в области медицинского искусственного интеллекта, выпуская две новые модели: MedGemma 1.5 и MedASR. В отличие от конкурентов, предлагающих платные решения, Google выбрал открытый подход, предоставив доступ к этим моделям для широкой исследовательской и разработческой аудитории.
MedGemma 1.5 — это обновленная версия модели, предназначенной для анализа медицинских изображений и текстовой информации. Она способна интерпретировать сканы, отвечать на вопросы, связанные с визуальными медицинскими данными, и помогать в различных исследовательских задачах. По данным Google Research, новая версия улучшила многомодальное рассуждение и повысила эффективность работы с комплексными медицинскими изображениями. Модель поддерживает различные виды медицинской визуализации, включая рентгеновские снимки, и предназначена для таких задач, как ответ на вопросы по изображениям, составление отчетов и извлечение структурированных данных. Однако Google подчеркивает, что модель не предназначена для диагностики или медицинских рекомендаций и должна использоваться только как вспомогательный инструмент в научных исследованиях.
В дополнение к MedGemma 1.5, Google представил MedASR — модель автоматического распознавания речи, специально разработанную для медицинских учреждений. MedASR предназначена для транскрипции устных клинических разговоров в текст, уделяя особое внимание медицинской терминологии и разнообразным акцентам. Эта модель поможет сократить количество ошибок транскрипции, которые часто возникают при использовании общих систем распознавания речи в медицинских контекстах. Возможные сценарии использования включают транскрипцию обсуждений между врачом и пациентом, создание клинических заметок и преобразование диктованных отчетов в текст.
Все версии MedGemma и MedASR доступны через платформы Hugging Face и Vertex AI. Разработчики могут также получить доступ к документации и учебным материалам через репозиторий MedGemma на GitHub.
Ключевые моменты:
- MedGemma 1.5 улучшает анализ медицинских изображений, интегрируя визуальные данные с текстовой информацией.
- MedASR фокусируется на точной транскрипции клинических разговоров, учитывая уникальные сложности медицинской терминологии.
- Открытый доступ Google поддерживает инновации и сотрудничество в разработке AI для здравоохранения.