Together AI

Together AI

AI Native Cloud. 오픈소스 모델 추론·학습·인프라 풀스택.

코딩유료미지원
0
평점
0
리뷰 수
2
플랫폼
2023
출시년도
Together AI 바로가기

소개

Together AI는 AI 네이티브 클라우드 플랫폼으로, 오픈소스 AI 모델의 추론·파인튜닝·프리트레이닝·스토리지를 원스톱으로 제공합니다. LPU 기반 초고속 추론, 배치 처리(30B 토큰/모델 규모), 전용 GPU 인프라, 코드 샌드박스(FlexSandbox), Together Kernel Collection(FlashAttention-4 등) 연구 기반 성능 최적화가 강점입니다.

주요 기능

오픈소스 모델 API
파인튜닝
배치 추론 (30B 토큰)
전용 GPU 인프라
FlexSandbox 코드 샌드박스
Together Kernel Collection
이미지·영상 생성 API

업데이트 히스토리

together-ai 정보 업데이트

  • tagline: AI Native Cloud 풀스택 플랫폼으로 재포지셔닝
  • description: FlexSandbox, FlashAttention-4, 배치 처리 추가
  • features: 최신 기능으로 업데이트

AI Native Conf — FlashAttention-4, ThunderAgent 등 발표

  • AI Native Conf에서 FlashAttention-4 공개 — 비대칭 하드웨어 확장을 위한 알고리즘·커널 파이프라이닝 공동 설계
  • ThunderAgent 발표 — AI 네이티브 클라우드용 차세대 에이전트 시스템
  • together.compile 공개 — 추론 최적화를 위한 새로운 컴파일러 프레임워크
  • 커널·RL·추론 최적화 전 영역에 걸친 연구 성과 동시 발표

Dedicated Container Inference 출시 — 커스텀 AI 모델 추론

  • Dedicated Container Inference 출시 — 커스텀 AI 모델에 대해 1.4×~2.6× 빠른 추론 제공
  • 커스텀 컨테이너 기반 프로덕션급 오케스트레이션으로 자체 모델 배포 간소화
  • Creatify, Hedra 등 주요 AI 기업이 이미 활용 중인 엔터프라이즈 인프라

가격

사용량 기반 요금 (Serverless / Dedicated)

지원 플랫폼

webapi