메뉴 엔크루 | 웹3 엔터와 게임

    한국어 English 日本語 中文
AI 분류

엔비디아, MS와 협력 확대

컨텐츠 정보

본문

엔비디아.jpg

 

엔비디아가 미국 시애틀에서 개최된 마이크로소프트 연례 개발자 콘퍼런스 ‘마이크로소프트 빌드 2024’에서 엔비디아 GTC에서 공유한 양사의 협력 상황을 바탕으로 지속적인 협업을 강화한다고 24일 밝혔다.


최적화된 AI 워크플로우가 하드웨어 인프라에서 소프트웨어 라이브러리에 이르기까지 각 구성 요소가 정확한 음을 내는 완벽하게 조율된 오케스트라에 비유될 수 있다면, 엔비디아와 마이크로소프트의 오랜 조화는 개발자의 귀에 음악과도 같은 존재다.


마이크로소프트에서 개발한 최신 AI 모델은 파이-3 소형 언어 모델 제품군을 포함한다. 또한 엔비디아 GPU에서 실행 가능하도록 최적화돼 엔비디아 NIM 추론 마이크로서비스로 사용할 수 있다. cuOpt 경로 최적화 AI와 같이 엔비디아에서 개발한 다른 마이크로서비스는 마이크로소프트 애저 마켓플레이스에 정기적으로 추가되고 있다. 이는 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼의 일부이다.


이러한 AI 기술 외에도 엔비디아와 마이크로소프트는 더 많은 최적화와 통합 세트를 제공하고 있다. 이를 통해 엔비디아 지포스 RTX와 엔비디아 RTX GPU 기반 PC용 고성능 AI 앱을 만드는 개발자를 지원한다.


마이크로소프트는 38억 개의 파라미터가 있는 파이-3-미니와 유사한 소형(70억 개 파라미터)과 중형(140억 개 파라미터) 모델을 추가해 파이-3 개방형 소형 언어 모델 제품군을 확장하고 있다. 또한 이미지와 텍스트를 지원하는 42억 개 파라미터의 새로운 멀티모달 모델인 파이-3-비전을 도입한다.


이 모든 모델은 엔비디아 텐서RT-LLM을 통해 GPU에 최적화돼 있다. 또한 엔비디아 NIM으로 사용할 수 있는데, 이는 어디에나 배포할 수 있는 표준 API를 갖춘 가속화된 추론 마이크로서비스이다.


NIM 기반 파이-3 모델용 API는 여기와 애저 마켓플레이스의 엔비디아 AI 엔터프라이즈에서 사용할 수 있다.


경로 최적화를 위한 GPU 가속 AI 마이크로서비스인 엔비디아 cuOpt가 이제 엔비디아 AI 엔터프라이즈를 통해 애저 마켓플레이스에서 제공된다. cuOpt는 배송 서비스, 철도 시스템, 창고와 공장 등에서 실시간 물류 관리를 가능하게 만드는 대규모 병렬 알고리즘을 지원한다.


이 모델은 주요 라우팅 벤치마크에서 24개에 달하는 세계 기록을 세우며 최고의 정확도와 신속성을 입증했다. 차량 경로를 최적화하고 이동 시간을 절약하며 유휴 기간을 최소화해 물류와 공급망 산업에서 수십억 달러를 절약할 수 있다.


개발자는 애저 마켓플레이스를 통해 cuOpt 마이크로서비스를 애저 맵스에 쉽게 통합할 수 있다. 이로써 엔터프라이즈급 관리 도구와 보안이 뒷받침된 실시간 물류 관리와 기타 클라우드 기반 워크플로우를 지원할 수 있다.


엔비디아 가속 컴퓨팅 플랫폼은 최신 AI의 중추로, 개발자들이 전 세계 1억 개 이상의 윈도우용 지포스 RTX 기반 PC와 엔비디아 RTX 기반 워크스테이션을 위한 솔루션 구축을 지원한다.


엔비디아와 마이크로소프트는 차세대 PC와 워크스테이션 애플리케이션에서 AI를 가속화하기 위해 윈도우 개발자에게 다음과 같은 새로운 최적화와 통합 기능을 제공한다.


엔비디아 다이렉트X 드라이버, 생성형 AI ONNX 런타임 확장과 다이렉트ML을 통해 거대 언어 모델에 대한 더 빠른 추론 성능을 제공한다. 이러한 최적화는 엔비디아 지포스 RTX와 엔비디아 RTX GPU에서 최대 3배 더 빠른 성능을 제공한다. 현재 지포스 게임 레디, 엔비디아 스튜디오X와 엔비디아 RTX 엔터프라이즈 드라이버에서 사용할 수 있다.


WebNN을 통해 스테이블 디퓨전과 위스퍼 같은 AI 모델을 위한 RTX GPU의 최적화된 성능을 제공한다. WebNN은 개발자가 온디바이스 하드웨어를 사용해 웹 애플리케이션에서 AI 모델을 가속화할 수 있도록 돕는 API이다.


윈도우가 다이렉트ML을 통해 파이토치를 지원하도록 설정되면 수천 개의 허깅페이스 모델이 윈도우에서 기본으로 작동한다. 엔비디아와 마이크로소프트는 1억 개 이상의 RTX GPU에서 성능을 확장하기 위해 협력하고 있다.

관련자료

한주의 인기기사


전체 1,202 / 18 페이지
RSS
  • 슈퍼워크, '아비트럼' 멀티체인 도입
    등록일 05.27 추천 0

    게임 프로그라운드가 운영하는 리워드형 웹3 헬스케어 플랫폼 '슈퍼워크'가 글로벌 확장 가속화를 위해 이더리움 레이어 2 '아비트럼'을 멀티체인으로 도…

  • 삼성 갤S24, AI폰 글로벌 점유율 '58%'
    등록일 05.31 추천 0

    AI 삼성전자가 올해 초 공개한 갤럭시 S24 시리즈가 생성형 인공지능(AI) 스마트폰 시장 ‘절반’ 이상을 점유한 것으로 나타났다. 31일 시장조사…

  • 갈라게임즈, 이머지 그룹과 MOU 체결
    등록일 06.05 추천 0

    게임 블록체인 게임 플랫폼 '갈라게임즈'가 '이머지 그룹(EMERGE Group)'과 전략적 파트너십(MOU)을 맺었다고 5일 밝혔다. 양사는 이번 …

  • '2024 국제 게임산업 컨퍼런스' 온오프라인 호황 속 폐막
    등록일 06.03 추천 1

    게임 '2024 국제 게임산업 컨퍼런스 with INDIECRAFT'가 양일간 온오프라인을 통해 약 1,500여명이 넘는 참관객이 참여하며 성공적으로…

  • 2024 플레이엑스포, B2B & B2C 성료
    등록일 06.04 추천 0

    게임 경기도가 주최하고 경기콘텐츠진흥원, 킨텍스가 주관하는 대한민국 대표 게임쇼인 '플레이엑스포(PlayX4)'가 지난 달 26일, 경기 고양시 킨텍…

  • 업비트, 블록체인 기술 활용한 추첨 툴 개발
    등록일 06.03 추천 0

    기타 가상자산 거래소 업비트가 블록체인 기술을 활용해 공정성과 투명성을 갖춘 추첨 툴을 개발했다고 3일 밝혔다. 추첨 툴은 최근 업비트와 금융감독원이…

  • 네이버클라우드, 통계청 AI 챗봇 서비스 구축
    등록일 05.30 추천 1

    AI 네이버클라우드가 한국통계정보원, 클라비와 함께 국가통계정보서비스의 디지털 혁신을 위한 업무협약을 체결했다고 30일 밝혔다. 3사는 통계청에서 추…

  • 엔비디아, MS와 협력 확대
    등록일 05.24 추천 0

    AI 엔비디아가 미국 시애틀에서 개최된 마이크로소프트 연례 개발자 콘퍼런스 ‘마이크로소프트 빌드 2024’에서 엔비디아 GTC에서 공유한 양사의 협력…

  • 소니, 'PS VR2' PV 어댑터 공개
    등록일 06.04 추천 1

    메타버스 소니인터렉티브엔터테인먼트는 지난 3일, 플레이스테이션 블로그를 통해 PC에서도 PS VR2로 VR 게임을 즐길 수 있도록 해주는 PS VR2 P…

커뮤니티


인기기사


많이본 리뷰


출시예정


알림 0