소개
Together AI는 AI 네이티브 클라우드 플랫폼으로, 오픈소스 AI 모델의 추론·파인튜닝·프리트레이닝·스토리지를 원스톱으로 제공합니다. LPU 기반 초고속 추론, 배치 처리(30B 토큰/모델 규모), 전용 GPU 인프라, 코드 샌드박스(FlexSandbox), Together Kernel Collection(FlashAttention-4 등) 연구 기반 성능 최적화가 강점입니다.
주요 기능
오픈소스 모델 API
파인튜닝
배치 추론 (30B 토큰)
전용 GPU 인프라
FlexSandbox 코드 샌드박스
Together Kernel Collection
이미지·영상 생성 API
업데이트 히스토리
together-ai 정보 업데이트
- •tagline: AI Native Cloud 풀스택 플랫폼으로 재포지셔닝
- •description: FlexSandbox, FlashAttention-4, 배치 처리 추가
- •features: 최신 기능으로 업데이트
AI Native Conf — FlashAttention-4, ThunderAgent 등 발표
- •AI Native Conf에서 FlashAttention-4 공개 — 비대칭 하드웨어 확장을 위한 알고리즘·커널 파이프라이닝 공동 설계
- •ThunderAgent 발표 — AI 네이티브 클라우드용 차세대 에이전트 시스템
- •together.compile 공개 — 추론 최적화를 위한 새로운 컴파일러 프레임워크
- •커널·RL·추론 최적화 전 영역에 걸친 연구 성과 동시 발표
Dedicated Container Inference 출시 — 커스텀 AI 모델 추론
- •Dedicated Container Inference 출시 — 커스텀 AI 모델에 대해 1.4×~2.6× 빠른 추론 제공
- •커스텀 컨테이너 기반 프로덕션급 오케스트레이션으로 자체 모델 배포 간소화
- •Creatify, Hedra 등 주요 AI 기업이 이미 활용 중인 엔터프라이즈 인프라
가격
사용량 기반 요금 (Serverless / Dedicated)
지원 플랫폼
webapi




