Groq

Groq

초고속 AI 추론 칩으로 LLM을 번개처럼 빠르게.

코딩프리미엄미지원

0

평점

0

리뷰 수

2

플랫폼

2024

출시년도

Groq 바로가기

소개

Groq는 자체 개발한 LPU(Language Processing Unit) 칩으로 LLM 추론을 초고속으로 처리하는 플랫폼입니다. Llama, Mixtral 등 오픈소스 모델을 매우 낮은 지연시간으로 제공하며, 개발자 API도 지원합니다.

주요 기능

초고속 LLM 추론

LPU 칩

오픈소스 모델

낮은 지연시간

API

업데이트 히스토리

2025년 12월 24일

NVIDIA 비독점 추론 기술 라이선스 계약 체결

•NVIDIA와 비독점 추론 기술 라이선스 계약 체결
•글로벌 규모의 AI 추론 가속화를 위한 전략적 파트너십

2025년 12월 18일

미국 에너지부 파트너십 체결

•미국 에너지부(DOE)와 AI 추론 및 차세대 컴퓨팅 인프라 발전을 위한 파트너십 체결
•11월: 시드니 데이터센터 오픈으로 아시아태평양 지역 확장

2025년 11월 25일

MCP 커넥터 베타 출시

•Model Context Protocol(MCP) 커넥터 지원
•외부 도구 및 데이터 소스 연결 가능
•에이전트 워크플로우 구축 간소화

가격

무료 (제한) / API 사용량 기반

지원 플랫폼

webapi

Groq의 대안

전체 대안 보기 →

Fal.AI

Fal.AI

AI 모델 API 플랫폼 — Flux, SDXL 등 수백 개 모델을 빠르게 연결

이미지 생성코딩

Replicate

Replicate

클라우드에서 AI 모델을 API로 실행하는 플랫폼.

Together AI

Together AI

AI Native Cloud. 오픈소스 모델 추론·학습·인프라 풀스택.