• «Билайн» совместно с российским производителем серверного оборудования разрабатывает комплексное решение для запуска и эксплуатации ИИ-моделей. В планах — размещение серверов в собственных дата-центрах и предоставление доступа к ним корпоративным клиентам по модели аренды. Новый сервис может стать востребованным у банков, ИТ-компаний и промышленности на фоне растущего интереса к инференсу и дефицита аналогичных решений в России.

    Билайн работает над платформой для инференса ИИ-моделей

    «Билайн» в сотрудничестве с одним из отечественных производителей серверного оборудования ведет работу над улучшением решений, предназначенных для инференса – процесса выполнения задач уже обученными моделями искусственного интеллекта.

    Оператор разрабатывает программное обеспечение для инфраструктуры, которое станет частью полного программно-аппаратного комплекса, рассказал «Ведомостям» заместитель гендиректора по IT «Вымпелкома» (бренд «Билайн») Антон Рубенчик. Этот комплекс в будущем позволит различным компаниям разворачивать у себя ИИ-модели. Планируется, что «Билайн» сможет размещать подобные серверы в собственных центрах обработки данных, предоставляя к ним доступ по модели аренды для корпоративных клиентов.

    Речь идет о сотрудничестве с компанией OpenYard, которая специализируется на производстве серверного оборудования, сообщил изданию источник. Представитель OpenYard подтвердил факт ведения переговоров с несколькими операторами связи, включая «Билайн», однако детали обсуждений раскрывать не стал.

    Как известно, обучение ИИ-моделей требует значительных вычислительных мощностей, в частности, использования тысяч графических ускорителей (GPU), однако на сегодняшний день в России пока не налажено производство оборудования такого уровня. Зато для последующего использования обученной модели – то есть на этапе инференса – требования к вычислительным ресурсам снижаются, и задействовать можно менее мощную технику.

    В РФ разработкой оборудования, подходящего для инференса, занимаются «Сбер», «Яндекс», OpenYard, а также стартапы. При этом основой таких решений остаются чипы иностранного производства – в основном это американские GPU, попавшие в страну до 2022 года, включая продукцию Nvidia, AMD (серия Instinct MI), а также в меньшем объеме — Intel.

    Антон Рубенчик также отметил, что на рынке наблюдается растущий интерес к аренде серверов с GPU, однако далеко не все клиенты готовы платить за такие ресурсы. По его словам, хотя инференс технически возможен и на обычных серверах, существующие решения пока не позволяют добиться сопоставимого с GPU-оборудованием качества работы.

    Эксперты отмечают, что инициатива «Билайна» и OpenYard может вылиться в полноценную услугу по аренде серверных мощностей с поддержкой развертывания ИИ, востребованную на рынке. Потенциальными клиентами такого сервиса станут банки, телеком- и IT-компании, а также крупные промышленные предприятия, которым нужны решения для автоматизации, аналитики и цифрового контроля. Для компаний с тысячами сотрудников стоимость такой услуги может достигать 100–200 млн рублей в год, а с учетом планируемого роста мощности российских ЦОДов до эквивалента 70 000 GPU Nvidia A100 к 2030 году, инвестиции в эту инфраструктуру могут составить от $1,5 до $2 млрд. Электронная подпись: как не стать жертвой мошенников Как машинное обучение меняет ландшафт борьбы с мошенничеством в рекламной сфере NGFW: останется только один. Недостатки и дружественные решения

    Источник

    Средний рейтинг
    0 из 5 звезд. 0 голосов.
  • Похожие записи