Новейшая ИИ-модель Microsoft Fara-7B подчеркивает локальную работу и конфиденциальность данных, позволяя предприятиям использовать её без опасений. Fara-7B обладает превосходной производительностью, выполняет сложные задачи через визуальное восприятие, демонстрируя безграничный потенциал ИИ-моделей. Microsoft 24 ноября официально представила новейшую ИИ-модель Fara-7B, модель с 7 миллиардами параметров, позиционируемую как «Агент использования компьютера» (Computer Use Agent, CUA), которая работает напрямую локально без необходимости в облачных вычислениях, сочетая высокую производительность и конфиденциальность данных. Ориентация на безопасность корпоративных данных, поддержка операций «визуального восприятия» Основа дизайна Fara-7B заключается в удовлетворении потребностей корпоративных клиентов в конфиденциальности и соответствии требованиям при обработке конфиденциальной информации. Благодаря компактности модели, она может работать на персональных компьютерах, что не только снижает задержки, но и предотвращает загрузку данных в облако, способствуя локальной автоматизации, например, для управления внутренними учетными записями и обработки конфиденциальных документов. Главная особенность этой модели — использование метода «наблюдения за экраном» для взаимодействия с веб-сайтами: она считывает макет экрана через скриншоты, а затем прогнозирует действия мыши, ввод или прокрутку. В отличие от традиционных методов, зависящих от структуры браузера, Fara-7B полностью основывается на данных пиксельного уровня для рассуждений, поэтому она может нормально работать даже с веб-сайтами с запутанной структурой кода. Менеджер продукта Microsoft Research Яш Лара отмечает, что Fara-7B реализует так называемый «пиксельный суверенитет» через локальную обработку визуальных входных данных, позволяя даже строго регулируемым отраслям, таким как здравоохранение и финансы, использовать её без опасений. Тестовая производительность превосходит GPT-4o, малая модель более эффективна В тестовом эталоне WebVoyager Fara-7B достигла 73,5% завершения задач, что выше, чем 65,1% у GPT-4o и 66,4% у UI-TARS-1.5-7B. Кроме того, Fara-7B в среднем требует всего 16 шагов для выполнения задачи, что значительно лучше, чем 41 шаг у UI-TARS-1.5-7B, достигая оптимального баланса между точностью и эффективностью. Fara-7B также вводит механизм «критических контрольных точек», который автоматически приостанавливается и запрашивает подтверждение при столкновении с личными данными пользователя или необратимыми операциями (такими как отправка писем или перевод денег), в сочетании с интерфейсом взаимодействия «Magentic-UI», обеспечивая безопасную линию человеко-машинного сотрудничества. Дистилляция знаний и обучение на примерах экспертов, усиление потенциала самостоятельного обучения Fara-7B использует метод обучения «дистилляция знаний», интегрируя 145 000 успешных примеров навигации, созданных мультиагентной системой Magentic-One, и сжимая их для обучения в единой модели. Кроме того, базовая модель основана на Qwen2.5-VL-7B, имеет контекстное окно до 128 000 токенов, обладает отличными возможностями выравнивания изображений и текста, а процесс обучения в основном фокусируется на имитации операций человека-эксперта. Microsoft заявляет, что в будущем не будет слепо стремиться к более крупным моделям, а сосредоточится на создании более «маленьких, умных и безопасных» моделей, и планирует внедрить обучение с подкреплением (RL) для самообучения в синтетических песочницах. Уже с открытым исходным кодом, доступна для свободного тестирования коммерческого использования, но еще не является официальным продуктом В настоящее время Fara-7B выпущена с открытым исходным кодом по лицензии MIT и доступна для загрузки на платформах Hugging Face и Microsoft Foundry, разрешено коммерческое использование. Однако Microsoft также предупреждает, что модель еще не соответствует стандартам развертывания в производственной среде и в настоящее время в основном подходит для разработчиков для тестирования прототипов и проверки функциональности. Дополнительное чтение: Google представляет WeatherNext 2, ИИ-модель прогноза погоды нового поколения, которая уже используется в Pixel, поиске и Gemini Дополнительное чтение: Исследователи обнаружили ленивый способ задавать вопросы, делающий ИИ более креативным, работает с любой ИИ-моделью, включая ChatGPT и Gemini Дополнительное чтение: Anthropic представляет малую ИИ-модель Claude Haiku 4.5: всего 1/3 стоимости, производительность на уровне Sonnet 4, в программировании даже немного лучше Присоединяйтесь к фан-странице T客邦 на FacebookНовейшая ИИ-модель Microsoft Fara-7B подчеркивает локальную работу и конфиденциальность данных, позволяя предприятиям использовать её без опасений. Fara-7B обладает превосходной производительностью, выполняет сложные задачи через визуальное восприятие, демонстрируя безграничный потенциал ИИ-моделей. Microsoft 24 ноября официально представила новейшую ИИ-модель Fara-7B, модель с 7 миллиардами параметров, позиционируемую как «Агент использования компьютера» (Computer Use Agent, CUA), которая работает напрямую локально без необходимости в облачных вычислениях, сочетая высокую производительность и конфиденциальность данных. Ориентация на безопасность корпоративных данных, поддержка операций «визуального восприятия» Основа дизайна Fara-7B заключается в удовлетворении потребностей корпоративных клиентов в конфиденциальности и соответствии требованиям при обработке конфиденциальной информации. Благодаря компактности модели, она может работать на персональных компьютерах, что не только снижает задержки, но и предотвращает загрузку данных в облако, способствуя локальной автоматизации, например, для управления внутренними учетными записями и обработки конфиденциальных документов. Главная особенность этой модели — использование метода «наблюдения за экраном» для взаимодействия с веб-сайтами: она считывает макет экрана через скриншоты, а затем прогнозирует действия мыши, ввод или прокрутку. В отличие от традиционных методов, зависящих от структуры браузера, Fara-7B полностью основывается на данных пиксельного уровня для рассуждений, поэтому она может нормально работать даже с веб-сайтами с запутанной структурой кода. Менеджер продукта Microsoft Research Яш Лара отмечает, что Fara-7B реализует так называемый «пиксельный суверенитет» через локальную обработку визуальных входных данных, позволяя даже строго регулируемым отраслям, таким как здравоохранение и финансы, использовать её без опасений. Тестовая производительность превосходит GPT-4o, малая модель более эффективна В тестовом эталоне WebVoyager Fara-7B достигла 73,5% завершения задач, что выше, чем 65,1% у GPT-4o и 66,4% у UI-TARS-1.5-7B. Кроме того, Fara-7B в среднем требует всего 16 шагов для выполнения задачи, что значительно лучше, чем 41 шаг у UI-TARS-1.5-7B, достигая оптимального баланса между точностью и эффективностью. Fara-7B также вводит механизм «критических контрольных точек», который автоматически приостанавливается и запрашивает подтверждение при столкновении с личными данными пользователя или необратимыми операциями (такими как отправка писем или перевод денег), в сочетании с интерфейсом взаимодействия «Magentic-UI», обеспечивая безопасную линию человеко-машинного сотрудничества. Дистилляция знаний и обучение на примерах экспертов, усиление потенциала самостоятельного обучения Fara-7B использует метод обучения «дистилляция знаний», интегрируя 145 000 успешных примеров навигации, созданных мультиагентной системой Magentic-One, и сжимая их для обучения в единой модели. Кроме того, базовая модель основана на Qwen2.5-VL-7B, имеет контекстное окно до 128 000 токенов, обладает отличными возможностями выравнивания изображений и текста, а процесс обучения в основном фокусируется на имитации операций человека-эксперта. Microsoft заявляет, что в будущем не будет слепо стремиться к более крупным моделям, а сосредоточится на создании более «маленьких, умных и безопасных» моделей, и планирует внедрить обучение с подкреплением (RL) для самообучения в синтетических песочницах. Уже с открытым исходным кодом, доступна для свободного тестирования коммерческого использования, но еще не является официальным продуктом В настоящее время Fara-7B выпущена с открытым исходным кодом по лицензии MIT и доступна для загрузки на платформах Hugging Face и Microsoft Foundry, разрешено коммерческое использование. Однако Microsoft также предупреждает, что модель еще не соответствует стандартам развертывания в производственной среде и в настоящее время в основном подходит для разработчиков для тестирования прототипов и проверки функциональности. Дополнительное чтение: Google представляет WeatherNext 2, ИИ-модель прогноза погоды нового поколения, которая уже используется в Pixel, поиске и Gemini Дополнительное чтение: Исследователи обнаружили ленивый способ задавать вопросы, делающий ИИ более креативным, работает с любой ИИ-моделью, включая ChatGPT и Gemini Дополнительное чтение: Anthropic представляет малую ИИ-модель Claude Haiku 4.5: всего 1/3 стоимости, производительность на уровне Sonnet 4, в программировании даже немного лучше Присоединяйтесь к фан-странице T客邦 на Facebook

Microsoft представляет компактную модель ИИ Fara-7B, работающую локально с производительностью, превосходящей GPT-4o

2025/11/28 13:30

Microsoft 24 ноября официально представила новейшую ИИ-модель Fara-7B. Эта модель с 7 миллиардами параметров позиционируется как «агент использования компьютера» (Computer Use Agent, CUA), отличающийся возможностью работы непосредственно на локальном устройстве без необходимости в облачных вычислениях, одновременно обеспечивая высокую производительность и конфиденциальность данных.

Ориентация на безопасность корпоративных данных с поддержкой «визуального восприятия»

Основа дизайна Fara-7B заключается в удовлетворении требований корпоративных клиентов к конфиденциальности и соответствию при обработке конфиденциальной информации. Благодаря компактности модели, она может работать на персональных компьютерах, что не только снижает задержки, но и предотвращает загрузку данных в облако, способствуя реализации локальной автоматизации, например, для управления внутренними учетными записями и обработки конфиденциальных документов.

Главная особенность этой модели — взаимодействие с веб-сайтами через «наблюдение за экраном» — чтение макета экрана через скриншоты и прогнозирование действий, таких как клики мышью, ввод или прокрутка. В отличие от традиционных методов, зависящих от структуры браузера, Fara-7B полностью основывается на данных на уровне пикселей для вывода, поэтому она может нормально работать даже с веб-сайтами, имеющими запутанную структуру кода.

По словам менеджера по продуктам исследовательского института Microsoft Яша Лара, Fara-7B обрабатывает визуальный ввод на локальном устройстве, реализуя так называемый «пиксельный суверенитет», что позволяет использовать его даже в строго регулируемых отраслях, таких как здравоохранение и финансы.

Тестирование показывает превосходство над GPT-4o, малая модель более эффективна

В тестовом эталоне WebVoyager, Fara-7B достигла 73,5% завершения задач, что выше, чем 65,1% у GPT-4o и 66,4% у UI-TARS-1.5-7B. Кроме того, Fara-7B в среднем требует всего 16 шагов для выполнения задачи, что значительно лучше, чем 41 шаг у UI-TARS-1.5-7B, достигая оптимального баланса между точностью и эффективностью.

Fara-7B также вводит механизм «критических контрольных точек» (critical checkpoints), который автоматически приостанавливает работу и запрашивает подтверждение при столкновении с личными данными пользователя или необратимыми операциями (например, отправкой писем или переводом денег), в сочетании с интерфейсом взаимодействия «Magentic-UI», обеспечивая безопасное взаимодействие человека и машины.

Дистилляция знаний и обучение на примерах экспертов усиливают потенциал самообучения

Fara-7B использует метод обучения «дистилляция знаний», интегрируя 145 000 успешных примеров навигации, созданных мультиагентной системой Magentic-One, и сжимая их для обучения в единой модели. Кроме того, базовая модель основана на Qwen2.5-VL-7B с контекстным окном до 128 000 токенов, обладающим превосходными возможностями выравнивания изображений и текста, а процесс обучения в основном фокусируется на имитации действий человека-эксперта.

Microsoft заявляет, что в будущем они не будут слепо стремиться к созданию более крупных моделей, а сосредоточатся на разработке более «маленьких, умных и безопасных» моделей, планируя внедрить обучение с подкреплением (RL) для самообучения в синтетической песочнице.

Уже с открытым исходным кодом, доступна для свободного тестирования и коммерческого использования, но еще не является официальным продуктом

В настоящее время Fara-7B выпущена с открытым исходным кодом по лицензии MIT и доступна для загрузки на платформах Hugging Face и Microsoft Foundry, разрешено коммерческое использование. Однако Microsoft предупреждает, что модель еще не соответствует стандартам развертывания в производственной среде и в настоящее время в основном подходит для разработчиков для тестирования прототипов и проверки функциональности.

  • Дополнительное чтение: Google представляет WeatherNext 2, ИИ-модель прогнозирования погоды нового поколения, уже доступную на Pixel, в поиске и Gemini
  • Дополнительное чтение: Исследователи обнаружили ленивый способ задавать вопросы, делающий ИИ более креативным, работающий с любыми ИИ-моделями, включая ChatGPT и Gemini
  • Дополнительное чтение: Anthropic представляет малую ИИ-модель Claude Haiku 4.5: всего 1/3 стоимости, производительность на уровне Sonnet 4, с даже немного лучшими результатами в программировании
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу [email protected] для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

Управление финансового поведения Великобритании заявляет, что поддержка стейблкоинов является 'приоритетом' на 2026 год

Управление финансового поведения Великобритании заявляет, что поддержка стейблкоинов является 'приоритетом' на 2026 год

Управление по финансовому регулированию и надзору Великобритании объявляет платежи стейблкоинами приоритетом на 2026 год, запуская инициативы регуляторной "песочницы" для ускорения внедрения цифровых активов
Поделиться
Coinspeaker2025/12/12 03:35