Together AI

Together AI

AI Native Cloud. 오픈소스 모델 추론·학습·인프라 풀스택.

코딩유료미지원

0

평점

0

리뷰 수

2

플랫폼

2023

출시년도

Together AI 바로가기

소개

Together AI는 AI 네이티브 클라우드 플랫폼으로, 오픈소스 AI 모델의 추론·파인튜닝·프리트레이닝·스토리지를 원스톱으로 제공합니다. LPU 기반 초고속 추론, 배치 처리(30B 토큰/모델 규모), 전용 GPU 인프라, 코드 샌드박스(FlexSandbox), Together Kernel Collection(FlashAttention-4 등) 연구 기반 성능 최적화가 강점입니다.

주요 기능

오픈소스 모델 API

파인튜닝

배치 추론 (30B 토큰)

전용 GPU 인프라

FlexSandbox 코드 샌드박스

Together Kernel Collection

이미지·영상 생성 API

업데이트 히스토리

2026년 3월 31일

together-ai 정보 업데이트

•tagline: AI Native Cloud 풀스택 플랫폼으로 재포지셔닝
•description: FlexSandbox, FlashAttention-4, 배치 처리 추가
•features: 최신 기능으로 업데이트

2026년 3월 5일

AI Native Conf — FlashAttention-4, ThunderAgent 등 발표

•AI Native Conf에서 FlashAttention-4 공개 — 비대칭 하드웨어 확장을 위한 알고리즘·커널 파이프라이닝 공동 설계
•ThunderAgent 발표 — AI 네이티브 클라우드용 차세대 에이전트 시스템
•together.compile 공개 — 추론 최적화를 위한 새로운 컴파일러 프레임워크
•커널·RL·추론 최적화 전 영역에 걸친 연구 성과 동시 발표

2026년 2월 12일

Dedicated Container Inference 출시 — 커스텀 AI 모델 추론

•Dedicated Container Inference 출시 — 커스텀 AI 모델에 대해 1.4×~2.6× 빠른 추론 제공
•커스텀 컨테이너 기반 프로덕션급 오케스트레이션으로 자체 모델 배포 간소화
•Creatify, Hedra 등 주요 AI 기업이 이미 활용 중인 엔터프라이즈 인프라

가격

사용량 기반 요금 (Serverless / Dedicated)

지원 플랫폼

webapi

Together AI의 대안

전체 대안 보기 →

Fal.AI

Fal.AI

AI 모델 API 플랫폼 — Flux, SDXL 등 수백 개 모델을 빠르게 연결

이미지 생성코딩

Groq

Groq

초고속 AI 추론 칩으로 LLM을 번개처럼 빠르게.

Replicate

Replicate

클라우드에서 AI 모델을 API로 실행하는 플랫폼.