Dari Token hingga Kepercayaan, Momen Bukti AI senilai $2,5 Triliun

JAKARTA: Selama dua tahun terakhir, strategi AI perusahaan didorong oleh satu pendorong utama: menjadi yang tercepat untuk menjadi yang terdepan dalam teknologi. Jalur paling umum yang dipilih hampir selalu sama: komputasi cloud publik, kunci API dari OpenAI, atau Anthropic, dan kesediaan untuk menyerap biaya demi mengejar kecepatan. Naluri ini telah memicu gelombang eksperimen yang luar biasa, tetapi sekarang mulai menemui jalan buntu.
Gartner memperkirakan pengeluaran global untuk AI akan mencapai US$2,52 triliun pada tahun 2026, meningkat 44% dibandingkan tahun sebelumnya, dengan US$1,37 triliun di antaranya dialokasikan khusus untuk infrastruktur AI. Di Asia Tenggara, investasi pada AI mengalami pertumbuhan tahunan sebesar 25%, dan total investasi pada AI diperkirakan akan melebihi US$110 miliar pada tahun 2028.
Faktanya, pada pertengahan tahun 2025, Gartner menyatakan bahwa AI dalam pengadaan akan memasuki fase “palung kekecewaan”, sebuah fase di mana ekspansi akan ditentukan oleh kepastian laba atas investasi yang terukur, dan bukan lagi sekedar proyek percontohan yang visioner. Fokus tekanan kini telah bergeser, dan bukan lagi pada seberapa cepat perusahaan dapat meluncurkan uji coba sistem AI, namun pada apakah mereka dapat menjaga keberlanjutan, tata kelola, dan memitigasi risiko pada tahap produksi.
Dari akses ke model tercanggih hingga ekonomi heuristik

Kita sedang keluar dari era AI 1.0. Akses ke model paling canggih adalah pembeda utama, menuju era AI 2.0, di mana keekonomian inferensi, gravitasi data, waktu akses, dan kontrol menentukan keuntungannya.
Meskipun harga token telah turun sekitar sepuluh kali lipat setiap tahun sejak tahun 2021, keseluruhan pengeluaran AI di sebagian besar perusahaan telah meningkat, bukan menurun, karena model yang semakin canggih memunculkan tindakan yang lebih ambisius.
Anthropic, OpenAI, dan Mistral kini mulai membedakan penawaran mereka, memisahkan model inferensi terkemuka dari model utilitas berbiaya rendah, karena pelanggan enggan membayar harga tinggi untuk setiap tugas.

Survei McKinsey State of AI pada tahun 2025 menegaskan pola ini – meskipun adopsi AI semakin meluas, masih sulit bagi sebagian besar organisasi untuk mencapai dampak transformasional dalam skala besar. Pertanyaan bagi manajer TI saat ini bukanlah model mana yang terbaik, melainkan beban kerja apa yang harus diterapkan pada platform apa, berapa biayanya, dan berdasarkan kebijakan apa yang harus diterapkan.

Tes tindakan terbaik berikutnya.
Ambil contoh kasus sebuah perusahaan yang sudah sangat familiar: sebuah bank yang menerapkan tindakan terbaik berikutnya, baik melalui aplikasi, interaksi kantor cabang, atau rekomendasi pusat panggilan yang disampaikan dalam hitungan milidetik berdasarkan konteks pelanggan secara real-time.
Bank-bank terbaik yang bekerja sama membuktikan bahwa kustomisasi pada lapisan ini dapat meningkatkan pendapatan sebesar 5-15%. Salah satu bank global yang berkolaborasi dengan kami meluncurkan asisten berbasis AI yang menyelesaikan lebih dari 1,5 juta pertanyaan nasabah hanya dalam tahun pertama beroperasi.

Namun, perhitungan matematis dalam inferensi tidak ada kompromi. Sebuah keputusan independen yang dibuat oleh sistem berbasis agen dapat menghasilkan antara lima hingga dua puluh panggilan tipikal, yang masing-masing membawa beban jendela konteksnya sendiri.
Perbedaan harga antara $0,50 dan $3,30 per juta entri token — yang tampak sepele dalam satu demo interaktif — menjadi faktor penentu apakah suatu fitur akan menghasilkan margin positif atau secara diam-diam menguras modal di tengah ratusan juta interaksi pelanggan.

Analisis terbaru menunjukkan bahwa perusahaan yang menggunakan satu model mutakhir/berbeda untuk setiap jenis tugas akan mengalami peningkatan pengeluaran sebesar 40-85% dalam biaya inferensi.
Decagon, setelah merombak infrastrukturnya menjadi tumpukan sumber terbuka multi-model yang berjalan pada infrastruktur NVIDIA Blackwell, mampu mengurangi biaya permintaan suara hingga enam kali lipat. Tindakan terbaik berikutnya bukan lagi sekadar keputusan pemasaran; Ini adalah keputusan ekonomi per unit, dan ditentukan secara tepat untuk setiap token yang dirutekan.

Kedaulatan menjadi strategis
Perdebatan antara cloud publik dan AI swasta bukan lagi soal ideologi, namun sangat bergantung pada jenis beban kerja, dan geopolitik kini berperan.

Kewajiban peraturan untuk sistem berisiko tinggi dalam undang-undang AI UE akan berlaku penuh pada bulan Agustus 2026, dengan ancaman denda hingga €35 juta atau 7% dari total omset global tahunan perusahaan; Perancis dan Jerman juga telah mulai mengarahkan kebijakan pengadaan sektor publik nasional mereka ke arah Mistral dan kedaulatan negara yang bersifat open-weight.

Di Asia, regulasi AI berkembang dengan menggunakan pendekatan yang sangat berbeda. Model Kerangka Tata Kelola AI dan alat pengujian IMDA di Singapura telah menjadi standar regional. Di Asia Timur, Jepang melalui Undang-Undang Promosi Kecerdasan Buatan telah menerapkan aturan sektoral selain pedoman sukarela, sedangkan Undang-Undang Dasar Kecerdasan Buatan Korea Selatan telah memberlakukan asuransi tanggung jawab wajib untuk sistem berisiko tinggi.
Sementara itu, India meluncurkan Sovereign LLM Program pada AI Impact Summit pada Februari 2026 dan mengalokasikan US$1,25 miliar untuk Proyek Misi IndiaAI, dengan implementasi UU DPDP secara bertahap hingga tahun 2027.
Upaya percepatan open source yang dipimpin oleh Tiongkok, pemberlakuan undang-undang PDP di Indonesia, dan pendekatan sektor pragmatis di Australia menambah lanskap peraturan yang sangat beragam – dan 96% organisasi di kawasan Asia-Pasifik berencana untuk meningkatkan investasi mereka pada AI, yang sebagian besar diterapkan melalui infrastruktur hibrida. Arsitektur AI yang hanya mengandalkan satu platform cloud dan satu yurisdiksi telah menjadi tanggung jawab struktural yang berisiko tinggi.

Kolaborasi inferensi hybrid dengan NVIDIA, serta peralihan yang lebih luas ke arah AI internal untuk beban kerja yang sangat terstruktur, merupakan respons langsung terhadap keadaan ini.

Keunggulan kompetitif sesungguhnya terletak di atas model
Pelajaran tersulit yang kami pelajari selama 18 bulan terakhir adalah bahwa mengkomoditisasi model tidak mengurangi kompleksitas perusahaan sama sekali, namun justru menghilangkannya. Memiliki model bobot terbuka dari Mistral atau DeepSeek telah berhasil mengurangi biaya eksperimen, namun beban koordinasi, tata kelola, evaluasi, dan integrasi sistem kini telah berpindah ke lapisan atas tumpukan dan harus ditanggung oleh pembeli.

Dinamika yang sama kini mulai terlihat pada AI fisik dan teknologi pertahanan. Perusahaan seperti Physical Intelligence, Fig AI, dan Skilled AI mendorong penerapan model robotika dasar ke dalam lingkungan pabrik, pusat pemenuhan logistik, dan rumah tangga, di mana latensi, kedaulatan, dan penyimpanan data jauh lebih penting daripada hasil benchmark.
Di sisi lain, Laboratorium Global Fei-Fei Li sedang berupaya membangun lapisan kecerdasan spasial – yaitu model global yang mampu memahami dan berpikir dalam ruang tiga dimensi – yang akan berfungsi sebagai jangkar bagi generasi kembar digital buatan berikutnya. Bahkan Palantir dan Anduril telah membangun seluruh lini bisnis mereka dengan asumsi bahwa bidang kendali, bukan model, adalah keunggulan kompetitif jangka panjang yang sebenarnya.

Pemimpin organisasi harus mulai mengukur keekonomian unit dari setiap tugas yang bernilai uang, beban operasional setiap agen pelaksana, dan proporsi biaya inferensi yang dialokasikan ke infrastruktur pendukung tata kelola di sekitarnya. Rasionya umumnya sekitar 1:5 atau bahkan lebih buruk lagi.

Apa langkah selanjutnya bagi bank, perusahaan telekomunikasi, dan produsen?
Transformasi arsitektur kedua kini mulai muncul: mekanisme perhatian kuasi-kuadrat. Pendekatan yang diusulkan oleh DeepSeek, Google, dan Cartesia telah berhasil mengurangi biaya penalaran dalam konteks panjang secara signifikan hingga beberapa kali lipat. Faktanya, hasil benchmark terbaru menunjukkan pengurangan biaya hingga 100-300 kali lipat dengan tetap menjaga tingkat akurasi yang sama.
Bagi bank-bank besar, hal ini mengubah pemodelan risiko tingkat portofolio, deteksi pola penipuan lintas kontrak, dan prosedur kepatuhan kenal pelanggan Anda (know-your-customer/KYC) lintas yurisdiksi menjadi proses satu kali, sehingga menghilangkan solusi yang memerlukan hashing dan pengambilan data (solusi pengambilan terpisah).

Bagi perusahaan telekomunikasi, operasi jaringan berbasis agen, pemeliharaan prediktif, dan penalaran riwayat perjalanan pelanggan multi-tahun telah menjadi strategi yang layak secara ekonomi dalam penerapan skala besar.
Bagi perusahaan manufaktur, simulasi operasional pabrik yang menyeluruh dan prakiraan gangguan rantai pasokan kini beralih dari perhitungan terjadwal secara berkala (pekerjaan batch berkala) menjadi perhitungan yang berkesinambungan dan real-time.

Desain yang akan memenangkan persaingan bukanlah desain yang sekadar menawarkan harga nominal termurah. Arsitektur yang akan muncul sebagai pemenang adalah arsitektur yang mampu menempatkan operasi komputasi sedekat mungkin dengan lokasi data, beroperasi di bawah yurisdiksi yang tepat, dan didukung oleh tata kelola yang kuat.
Berkelanjutan, berdaulat, terkendali – inilah trinitas baru yang menjadi fondasi penting. Perusahaan yang mulai Anda bangun sekarang akan menentukan arah lanskap bisnis pada dekade mendatang.

(Abhas Ricky, CEO & GM, AI Cloudera Terapan)
Jadikan Servisenta.biz.id sebagai sumber informasi pilihan Anda

(MMI)

(tag untuk terjemahan)cloudera