Groq

Groq

초고속 AI 추론 칩으로 LLM을 번개처럼 빠르게.

코딩프리미엄미지원
0
평점
0
리뷰 수
2
플랫폼
2024
출시년도
Groq 바로가기

소개

Groq는 자체 개발한 LPU(Language Processing Unit) 칩으로 LLM 추론을 초고속으로 처리하는 플랫폼입니다. Llama, Mixtral 등 오픈소스 모델을 매우 낮은 지연시간으로 제공하며, 개발자 API도 지원합니다.

주요 기능

초고속 LLM 추론
LPU 칩
오픈소스 모델
낮은 지연시간
API

업데이트 히스토리

NVIDIA 비독점 추론 기술 라이선스 계약 체결

  • NVIDIA와 비독점 추론 기술 라이선스 계약 체결
  • 글로벌 규모의 AI 추론 가속화를 위한 전략적 파트너십

미국 에너지부 파트너십 체결

  • 미국 에너지부(DOE)와 AI 추론 및 차세대 컴퓨팅 인프라 발전을 위한 파트너십 체결
  • 11월: 시드니 데이터센터 오픈으로 아시아태평양 지역 확장

MCP 커넥터 베타 출시

  • Model Context Protocol(MCP) 커넥터 지원
  • 외부 도구 및 데이터 소스 연결 가능
  • 에이전트 워크플로우 구축 간소화

가격

무료 (제한) / API 사용량 기반

지원 플랫폼

webapi