Функция Gemini Nano увеличивает вовлеченность в приложение Pixel Recorder на 24%
от: 29-08-2024 15:27 | раздел: Новости
Приложение Pixel Recorder от Google, известное своими возможностями голосовых заметок, в основном используется для коротких заметок, несмотря на его потенциал для записи встреч и лекций.
Однако в наши дни люди все чаще используют приложение Recorder, поскольку разработчики приложения обратились к Gemini Nano, которая представляет собой мощную большую языковую модель (LLM) на устройстве. Эта интеграция представляет функцию аудиосуммирования на основе ИИ, которая помогает пользователям легче находить нужные записи и быстро понимать ключевые моменты.
Ранее в этом месяце Gemini Nano получил обновление с введением новой модели мультимодальности. Приложение Recorder уже использует это улучшение для лучшего обобщения длинных голосовых записей, предлагая улучшенную обработку грамматики и нюансов.
Пользователи Recorder теперь используют новую функцию обобщения на основе ИИ в среднем от 2 до 5 раз в день, что привело к увеличению общего количества сохраненных записей на 24%. Эта функция значительно повысила вовлеченность приложения и удержание пользователей. Команда Recorder также сообщила, что отзывы о новой функции были положительными, и многие пользователи оценили время, которое она им экономит.
Разработчики Recorder изначально исследовали облачное решение, достигая высокой производительности и качества. Однако для повышения доступности и конфиденциальности для пользователей они выбрали подход на устройстве. Разработка Gemini Nano предоставила идеальную возможность создавать краткие аудиообзоры, гарантируя, что обработка данных останется на устройстве.
Наличие LLM на устройстве выгодно для пользователей, поскольку оно обеспечивает им большую конфиденциальность, меньшую задержку и работает там, где им нужно, поскольку не требуется интернет.– Кристи Брэдфорд, менеджер по продуктам основных приложений Pixel, август 2024 г.
Чтобы улучшить результаты, Recorder настроил модель с использованием данных, специфичных для ее варианта использования, используя адаптацию низкого ранга (LoRA). Это позволяет Gemini Nano последовательно генерировать сводки из трех пунктов транскриптов, включая имена говорящих, основные выводы и темы.
Разработчики Recorder интегрировали новейшую модель Gemini Nano, известную как Gemini Nano с мультимодальностью, для улучшения ее функции реферирования на устройствах Pixel 9. Эта новая модель, более крупная и продвинутая, чем ее предшественница на устройствах Pixel 8, предлагает улучшенные возможности, точность и масштабируемость. Она также поддерживает большее количество токенов, что позволяет Recorder реферировать гораздо более длинные транскрипты, чем раньше. В настоящее время Gemini Nano с мультимодальностью доступна исключительно на устройствах Pixel 9.
Чтобы в полной мере использовать возможности новой модели, разработчики Recorder расширили свой набор данных, включив в него более длинные голосовые записи, усовершенствовали методы оценки и установили метрики критериев запуска, ориентированные на грамматику и нюансы.
Иван Ковалев
VIA
Подписывайтесь и читайте новости от ITквариат раньше остальных в нашем
Telegram-канале !
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!
И еще об интересном...
Почему современные компьютерные игры используют так много видеопамяти?Как Microsoft создает Xbox One X - самую мощную игровую консоль в мире (+видео)Xbox One vs PS4: Самое детальное сравнение двух платформLG G6: большой тест - обзорБюджетный и производительный. Компактный NAS-сервер Thecus N2810Apple iPod, 15 лет триумфа…Микро-квадрокоптер SYMA X12S Nano. Испытание размером