
Countdown resmi dimulai: re:Invent 2025 berlangsung 1–5 Desember di Las Vegas—panggung tempat AWS harus membuktikan bahwa “infrastruktur” bisa mengalahkan “model unggulan.” :contentReference{index=0}
Apa yang (paling mungkin) jadi tembakan besar:
1) Infrastruktur & Chip: Bukan sekadar mengejar, AWS datang dengan amunisi—Trainium2 sudah GA dan dipakai dalam superklaster “Project Rainier” (ratusan ribu chip) yang disiapkan untuk Anthropic; roadmap resmi menyebut Trainium3 hadir akhir 2025 (≈4× performa UltraServer T2). Ini inti narasi “harga-performa” untuk menekan dominasi Nvidia. :contentReference{index=1}
2) “Perang Model” versi AWS: Setelah keluarga Nova (Micro/Lite/Pro; Premier in-train) muncul tahun lalu, ekspektasi wajar adalah refresh/penajaman Nova + kurasi model pihak ketiga lewat Bedrock (termasuk Claude dari Anthropic yang makin dalam kemitraannya dengan AWS). Fokus: biaya lebih rendah, latency lebih kecil, dan opsi agen. :contentReference{index=2}
3) “AI di Mana-Mana”: AWS sudah menanam GenAI ke layanan inti—dari Aurora ↔ Bedrock (SQL call ke FM & vector store untuk RAG) sampai tool agen seperti AgentCore dan multi-agent collaboration. Di re:Invent, pola ini hampir pasti diperluas (database, data/ETL, call center, observability). :contentReference{index=3}
Kenapa ini pertaruhan “harga diri” Amazon?
- Narasi efisiensi biaya: Andy Jassy berulang kali menekankan penurunan biaya AI via inovasi chip & arsitektur—Trainium2/3, klaster skala gila (Rainier), dan diversifikasi dari “satu vendor”. re:Invent adalah etalase untuk membuktikan metrik nyata (token per dolar, watt per token). :contentReference{index=4}
- Jaringan aliansi: Anthropic jadi kartu truf—Bedrock + Trainium untuk pelatihan dan serving Claude di AWS, meski Anthropic tetap multi-cloud (baru saja mengamankan 1M TPU dengan Google). AWS harus menunjukkan bahwa “rumah utama” Claude tetap memberi keunggulan di performa-biaya-governance. :contentReference{index=5}
- Produk enterprise menyatu: dari SageMaker Unified Studio sampai Q/agentic suite—yang menang bukan model paling pintar, tapi platform yang mengantar ide → produksi dalam hitungan jam, diawasi TRiSM. :contentReference{index=6}
Catatan rumor: isu “chip baru” berkode “Kumo” belum punya rujukan tepercaya. Indikasi resmi yang ada tetap berporos pada Trainium2 (GA) dan Trainium3 (late-2025). Sampai ada publikasi kredibel, anggap “Kumo” sekadar spekulasi. :contentReference{index=7}
Yang wajib Anda pantau saat keynote:
- Angka keras: $/1M token, throughput/token-latency, dan footprint energi vs alternatif.
- Integrasi lintas layanan: Bedrock ke Aurora/Redshift/Glue/Connect out-of-the-box (tanpa lem kustom). :contentReference{index=8}
- Agen produksi: audit trail, guardrail, observability untuk multi-agent (bukan sekadar demo). :contentReference{index=9}