Пришло время воздать должное невероятным женщинам, лидирующим в области искусственного интеллекта! Номинируйте своих вдохновляющих лидеров на премию VentureBeat «Женщины в искусственном интеллекте» сегодня, до 18 июня. Узнать больше
Гугл Близнецы ему всего 6 месяцев, но он уже продемонстрировал впечатляющие возможности во всем мире. безопасность, кодирование, отладка и других областях (конечно, он выставил серьезные ограниченияслишком).
Сейчас большая языковая модель (LLM) превосходит людей, когда дело доходит до советов по сну и фитнесу.
Исследователи из Google представили Большая языковая модель личного здоровья (PH-LLM), версия Gemini, настроенная для понимания и анализа временных рядов личных данных о состоянии здоровья, получаемых с носимых устройств, таких как умные часы и пульсометры. В своих экспериментах модель отвечала на вопросы и делала прогнозы заметно лучше, чем эксперты с многолетним опытом работы в сфере здоровья и фитнеса.
«В нашей работе… работают генеративный ИИ расширить полезность модели от простого прогнозирования состояния здоровья до предоставления последовательных, контекстуальных и потенциально предписывающих результатов, которые зависят от сложного поведения в отношении здоровья», — пишут исследователи.
Регистрация на VB Transform 2024 открыта
Присоединяйтесь к лидерам предприятий в Сан-Франциско с 9 по 11 июля на нашем флагманском мероприятии по искусственному интеллекту. Общайтесь с коллегами, изучайте возможности и проблемы генеративного искусственного интеллекта и узнайте, как интегрировать приложения искусственного интеллекта в вашу отрасль. Зарегистрироваться
Близнецы как эксперт по сну и фитнесу
Носимые технологии могут помочь людям контролировать и, в идеале, вносить значимые изменения в свое здоровье. Эти устройства предоставляют «богатый и постоянный источник данных» для мониторинга личного здоровья, который «пассивно и постоянно собирается» из таких входных данных, как журналы тренировок и диеты, журналы настроения, а иногда даже активности в социальных сетях, отмечают исследователи Google.
Однако данные, которые они собирают о сне, физической активности, кардиометаболическом здоровье и стрессе, редко включаются в клинические условия, которые носят «спорадический характер». Скорее всего, полагают исследователи, это связано с тем, что данные собираются без контекста и требуют большого количества вычислений для хранения и анализа. Кроме того, это может быть сложно интерпретировать.
Кроме того, хотя программы LLM преуспели, когда дело доходит до медицинские вопросы-ответыанализ электронных медицинских записей, постановка диагноза на основе медицинских изображений и психиатрических оценок — им часто не хватает способности рассуждать и давать рекомендации на основе данных, полученных с носимых устройств.
Однако Google исследователи совершили прорыв в обучении PH-LLM давать рекомендации, отвечать на вопросы профессионального экзамена и прогнозировать нарушения сна, о которых сообщают сами пациенты, и результаты ухудшения сна. Модели были заданы вопросы с несколькими вариантами ответов, а исследователи также применили методы цепочки мыслей (имитирующие человеческое мышление) и методы нулевого выстрела (распознавание объектов и концепций, не сталкиваясь с ними раньше).
Впечатляет, что PH-LLM набрал 79% баллов на экзамене по сну и 88% на экзамене по фитнесу — оба показателя превысили средние оценки выборки экспертов-людей, в том числе пяти профессиональных спортивных тренеров (со средним опытом работы 13,8 лет) и пяти экспертов по медицине сна. (со средним стажем 25 лет). Люди достигли среднего показателя 71% по физической форме и 76% по сну.
В одном из примеров коучинговых рекомендаций исследователи предложили модель: «Вы эксперт в области медицины сна. Вам предоставлены следующие данные о сне. Пользователь мужчина, 50 лет. Перечислите наиболее важные идеи».
PH-LLM ответил: «У них проблемы с засыпанием… достаточный глубокий сон». [is] важно для физического восстановления». Далее модель посоветовала: «Убедитесь, что в вашей спальне прохладно и темно… избегайте сна и соблюдайте постоянный график сна».
Между тем, когда ему задали вопрос о том, какой тип мышечного сокращения происходит в большой грудной мышце «во время медленной, контролируемой фазы опускания жима лежа?» Учитывая четыре варианта ответа, PH-LLM правильно ответил «эксцентрично».
Что касается доходов, зарегистрированных пациентами, исследователи спросили модель: «На основании этих носимых данных, будет ли пользователь сообщать о трудностях с засыпанием?», на что модель ответила: «Этот человек, скорее всего, сообщит, что испытывает трудности с засыпанием несколько раз в течение последний месяц».
Исследователи отмечают: «Хотя дальнейшее развитие и оценка необходимы в критически важной для безопасности области личного здоровья, эти результаты демонстрируют как широкую базу знаний, так и возможности Модели Близнецов».
Близнецы могут предложить персонализированную информацию
Чтобы достичь этих результатов, исследователи сначала создали и курировали три набора данных, в которых проверялись персонализированные идеи и рекомендации на основе данных о физической активности, характере сна и физиологических реакциях; экспертные знания в предметной области; и прогнозы относительно качества сна по самооценке.
В сотрудничестве с экспертами в предметной области они создали 857 тематических исследований, представляющих реальные сценарии сна и фитнеса — 507 для первого и 350 для второго. В сценариях сна использовались индивидуальные показатели для выявления потенциальных причинных факторов и предоставления персонализированных рекомендаций, которые помогут улучшить качество сна. В фитнес-задачах использовалась информация о тренировках, сне, показателях здоровья и отзывы пользователей для создания рекомендаций по интенсивности физической активности в определенный день.
Обе категории тематических исследований включали данные носимых датчиков — до 29 дней для сна и более 30 дней для фитнеса — а также демографическую информацию (возраст и пол) и экспертный анализ.
Данные датчиков включали общие оценки сна, частоту сердечных сокращений в состоянии покоя и изменения вариабельности сердечного ритма, продолжительность сна (время начала и окончания), минуты бодрствования, беспокойство, процент времени быстрого сна, частоту дыхания, количество шагов и минуты сжигания жира.
«Наше исследование показывает, что PH-LLM способен интегрировать пассивно полученные объективные данные с носимых устройств в персонализированную информацию, потенциальные причины наблюдаемого поведения и рекомендации по улучшению гигиены сна и результатов в фитнесе», — пишут исследователи.
Еще много работы предстоит проделать в приложениях для личного здоровья
Тем не менее, исследователи признают, что PH-LLM — это только начало, и, как и у любой новой технологии, у нее есть ошибки, над которыми нужно работать. Например, ответы, сгенерированные моделью не всегда были последовательны, были «заметные различия» в выдумках в различных тематических исследованиях, а LLM иногда была консервативной или осторожной в своих ответах.
В тематических исследованиях фитнеса модель была чувствительна к перетренированности, и в одном случае эксперты-люди отметили ее неспособность идентифицировать недосыпание как потенциальную причину вреда. Кроме того, тематические исследования были выборкой по широкому кругу демографических групп и относительно активных людей, поэтому они, вероятно, не были полностью репрезентативными для населения и не могли решить более широкие проблемы сна и фитнеса.
«Мы предупреждаем, что еще предстоит проделать большую работу, чтобы гарантировать надежность, безопасность и справедливость программ LLM в сфере личного здравоохранения», — пишут исследователи. Это включает в себя дальнейшее сокращение путаницы, рассмотрение уникальных обстоятельств здоровья, не фиксируемых сенсорной информацией, и обеспечение того, чтобы данные обучения отражали разнообразие населения.
Однако в целом исследователи отмечают: «Результаты этого исследования представляют собой важный шаг на пути к программам LLM, которые предоставляют персонализированную информацию и рекомендации, которые помогают людям достичь своих целей в области здравоохранения».