Sesuatu yang diam-diam berbalik dalam komputasi AI tahun ini, dan itu mengubah untuk apa sebenarnya pembangunan itu.
Pada tahun 2023, 2/3 dari komputasi AI digunakan untuk pelatihan, pekerjaan sebenarnya dalam membangun model. Bagian lainnya yang lebih kecil digunakan untuk inferensi, pekerjaan menjalankannya setelah jadi. Namun rasio itu diam-diam mulai berbalik.
Inferensi kini menjadi 2/3 dan masih meningkat, menurut Deloitte, dan chip yang dibuat untuk menjalankannya telah melampaui $50B tahun ini.
Alasan utama pembalikan ini penting (dan bukan dari segi persentase): pelatihan dan inferens

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

20jam yang lalu

Dua tahun yang lalu, model terbuka di bagan ini akan berada di dekat posisi terbawah. Laboratorium tertutup sudah unggul beberapa generasi, dan kesenjangan itulah alasan utama orang menyewa model alih-alih memilikinya.
Sekarang GLM-5.2 berada di peringkat 51 pada indeks @ArtificialAnlys.
Bobot terbuka, laboratorium Tiongkok, peringkat kelima secara keseluruhan. Dan singkirkan Fable dari daftar karena tidak tersedia, dan model bobot terbuka jauh lebih dekat ke puncak daripada yang ditunjukkan oleh peringkatnya.
Argumen utama untuk model tertutup selalu soal keunggulan. Bayar API, terima persyar

GLM3,60%

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

06-25 10:51

Inilah pembagian dalam komputasi AI yang tidak banyak dibaca dengan benar.
Pelatihan frontier semakin terkonsentrasi setiap kuartal, ribuan GPU yang harus ditempatkan di satu tempat dan dihubungkan. Namun pelatihan hanya 30% dari permintaan pada tahun 2026. 70% lainnya adalah inferensi, dan menjalankannya di hyperscaler berarti membayar infrastruktur yang dibangun untuk beban kerja terberat untuk melakukan yang termudah.
Di jaringan terdistribusi, inferensi yang sama bisa berjalan 45-75% lebih murah dan bagi siapa pun yang menyusun anggaran infrastruktur AI, kesenjangan itulah intinya.
Pelatih

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

06-24 21:38

Sudah memikirkan tentang berita GLM 5.2 terbaru dan sudut pandang open weights yang dikejar semua orang, tetapi mereka melewatkan sudut pandang yang sama sekali berbeda di sini.
Semua orang fokus pada fakta bahwa sebuah laboratorium China mencapai performa level frontier dan membuka sumbernya, tetapi bagian yang layak direnungkan adalah bagaimana. ZAI dan laboratorium China lainnya diputus dari Nvidia pada awal tahun 2025, jadi mungkin tidak ada H100, tidak ada H200 yang langsung ke mereka sejak saat itu.
Mereka melampaui $128B on model yang dilatih pada silikon China yang mungkin berada dalam

GLM3,60%

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

06-24 10:17

95% dari kapasitas GPU perusahaan saat ini sedang tidak digunakan.
Angka tersebut berasal dari pengukuran Cast AI terhadap 23.000 klaster produksi nyata, bukan survei umum.
Rata-rata pemanfaatan adalah 5% dan ini terjadi pada saat Nvidia menaikkan harga H200 sebesar 15%, kenaikan pertama dalam 20 tahun. Perangkat keras yang dikatakan langka oleh semua orang sebagian besar tidak melakukan apa-apa.
Jika Anda mencoba mencari tahu mengapa komputasi terasa tidak mungkin didapatkan, inilah alasannya. Tidak ada yang mengembalikan alokasi yang mereka tunggu berbulan-bulan. Jadi armada tetap di 5%, dit

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

06-23 08:40

Beberapa langkah besar kebijakan AI UE dilaporkan akan datang tetapi inilah kenyataan infrastruktur yang mereka kerjakan.
> Pengeluaran infrastruktur AI berdaulat UE pada tahun 2026: $12,6 miliar.
> Capex hyperscaler AS pada tahun yang sama: $725 miliar.
Eropa menghabiskan enam tahun membangun 19 Pabrik AI dan 14 superkomputer dan hanya Amazon saja akan menghabiskan seluruh usaha itu dalam dua minggu tahun ini.
Sebagian besar tim AI Eropa tidak menggunakan infrastruktur Eropa. Mereka menyewa dari Virginia dan Iowa dan membayar premi kepatuhan GDPR di atas margin hyperscaler sebagai hak istimew

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

06-22 08:41

Saya tidak menyangka angka ini akan muncul tahun ini.
GitHub berada pada jalur untuk mencapai 14 miliar komitmen pada tahun 2026 sejauh ini.
Itu naik dari 1 miliar pada tahun 2025.
Peningkatan 14x dalam satu tahun dan sebagian besar bukan dari manusia yang menulis kode.
Beban menjadi sangat berat sehingga Microsoft, yang memiliki dan mengoperasikan cloud terbesar kedua di dunia, harus mengarahkan lalu lintas melalui AWS agar platform tetap online.
Sembilan insiden layanan hanya pada bulan Mei.
Ketersediaan turun menjadi 88,4%.
Untuk setiap tim rekayasa, vendor infrastruktur, dan

Lihat Asli

1 Suka

Hadiah
1
Komentar
Posting ulang
Bagikan

torygreen

06-20 08:26

Pendapatan Nvidia adalah bukti bahwa "komputasi agenik" bukanlah sebuah teori. Itu sudah ada di laporan pendapatan.
$26B empat tahun yang lalu. $215,9Miliar tahun lalu. Itu terjadi 8 kali lipat sementara sebagian besar AI masih duduk di kotak obrolan menunggu Anda bertanya.
Bagian penting bukan hanya pertumbuhannya. Tapi Nvidia mengubah arsitekturnya menjadi input yang tidak bisa dinegosiasikan lagi untuk hampir semua orang lain dalam peta jalan mereka. Laboratorium, cloud, perusahaan. Logo berbeda di API, silikon yang sama di bawahnya. Hampir setiap dolar yang dihabiskan untuk infrastruktur A

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

06-19 16:48

Saya tidak menyangka angka lima tahun Goldman akan sebesar ini.
Lima hyperscaler diperkirakan akan menghabiskan $5,3 triliun untuk infrastruktur AI antara 2025 dan 2030. Pada 2022 mereka menghabiskan $162B secara gabungan.
Tahun ini mereka berada di jalur untuk mencapai $725 miliar. Pada 2027 analis memproyeksikan $1 triliun dalam satu tahun.
Bagi siapa saja yang membangun produk atau infrastruktur AI di luar lima neraca ini, trajektori ini adalah angka terpenting dalam asumsi perencanaan Anda.
Kesenjangan antara apa yang dapat mereka deploy dan apa yang dapat diakses semua orang lain

Lihat Asli

1 Suka

Hadiah
1
Komentar
Posting ulang
Bagikan

torygreen

06-18 19:30

Semua orang memprediksi AI akan mengambil alih pekerjaan administratif yang berulang terlebih dahulu. Data menunjukkan hal yang berbeda.
Pengambilan keputusan sekarang merupakan 28% dari aktivitas AI di tempat kerja. Kasus penggunaan nomor satu bukanlah otomatisasi. Itu adalah penilaian.
Orang-orang menggunakan AI untuk menganalisis opsi, menimbang tradeoff, dan mendukung kesimpulan yang menjadi tanggung jawab mereka dan pergeseran itu penting di luar pertanyaan pasar tenaga kerja.
Beban kerja berbasis penilaian berjalan terus-menerus, membutuhkan lebih banyak konteks per sesi, dan tida

Lihat Asli

2 Suka

Hadiah
2
1
Posting ulang
Bagikan

Millionairetasks:

Kesempatan besar bagi semua orang untuk menjadi

torygreen

06-18 08:12

Infrastruktur cloud global Q1 2026. $129 miliar dalam satu kuartal. Tumbuh 35% dari tahun ke tahun.
Pasar berkembang pesat tetapi konsentrasi tidak berubah. AWS, Azure, dan Google Cloud memegang bagian yang sama sekitar dua tahun lalu seperti yang mereka pegang hari ini, tetapi jarak absolut di antara mereka dan semua yang lain lebih lebar dalam hal dolar daripada sebelumnya.
Itulah bagian yang tidak ditunjukkan oleh grafik persentase. Potongan Others tidak tumbuh menjadi alternatif yang nyata. Itu tetap proporsional sama sementara tiga hyperscaler menambahkan puluhan miliar dolar dalam pe

Lihat Asli

1 Suka

Hadiah
1
Komentar
Posting ulang
Bagikan

torygreen

06-16 22:28

PJM menjalankan jaringan listrik di 13 negara bagian AS dan 65 juta orang. Ini adalah pasar listrik grosir kompetitif terbesar di dunia.
Harga pembersihan pasar kapasitasnya, tarif yang memberi sinyal apakah pasokan listrik di masa depan dapat memenuhi permintaan, telah naik dari $28,92 per MW pada 2024 menjadi $329,17 pada 2026. Dua siklus lelang.
Permintaan pusat data diidentifikasi sebagai pendorong utama. Lelang 2027/2028 baru saja selesai di $333,44, dengan PJM secara langsung mengaitkan peningkatan beban sebesar 5.100 MW ke pusat data.
Itu bukan kejutan pasokan atau peristiwa geopolitik.

Lihat Asli

3 Suka

Hadiah
3
2
Posting ulang
Bagikan

DiveNate:

2026 GOGOGO 👊

Lihat Lebih Banyak

torygreen

06-15 15:28

Dua angka dari grafik ini.
Harga API AI: turun 96% sejak 2022.
Capex hyperscaler: naik 12x dalam jangka waktu yang sama.
Kebanyakan orang melihat angka pertama dan menyebutnya demokratisasi, tetapi tidak ada yang membangun strategi berdasarkan angka kedua.
Itu bukan kebetulan. Itu adalah permainan penangkapan struktural.
Setiap startup AI yang merayakan model murah berjalan di atas komputasi yang tidak mereka miliki, di infrastruktur yang tidak bisa mereka replikasi, dikendalikan oleh tiga perusahaan.
AI berdaulat dimulai dengan infrastruktur berdaulat. Segala sesuatu lainnya hanyalah ketergan

Lihat Asli

1 Suka

Hadiah
1
1
Posting ulang
Bagikan

Yuhuan:

gsgsgshsokzkzkzkxhxj

torygreen

06-14 07:14

Hal yang diungkapkan Jumat bukanlah bahwa pemerintah dapat menutup model AI.
Itu bahwa seluruh basis pengguna global dari model paling canggih di dunia berada di balik satu keputusan operasional oleh satu perusahaan yang merespons satu arahan. Tanpa redundansi atau peringatan.
Tiga dari perusahaan AI terbesar saat ini mengendalikan 88% akses AI frontier dan satu permukaan kepatuhan untuk semuanya.
Apa yang dibuat Jumat menjadi terlihat adalah bahwa ketika akses komputasi dan model berada di dalam genggaman beberapa perusahaan, seluruh tumpukan mewarisi titik kegagalan tunggal mereka.
I

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

06-12 14:51

Pada tahun 2024, peta komputasi AI memiliki dua kekuatan super. AS sebesar 53,7 GW, China sebesar 31,9 GW.
Pada tahun 2026, China berada di 2,5 GW.
Itu adalah penghancuran terkendali kapasitas infrastruktur AI sebuah negara melalui kebijakan ekspor. Tidak ada bom, tidak ada sanksi, hanya aturan chip.
Apa yang dibuktikan ini adalah bahwa komputasi sekarang menjadi senjata geopolitik. Negara mana pun yang tidak memiliki infrastruktur sendiri tidak ingin tahu bagaimana rasanya menjadi penerima senjata tersebut.
Pertanyaannya bukan apakah komputasi terdesentralisasi menang. Tapi apakah itu

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

06-10 17:36

IPO teknologi terbesar tahun 2000-an adalah Visa sebesar $28Miliar. Yang terbesar dari tahun 2010-an adalah Alibaba sebesar $168Miliar. Sekitar 6x per dekade.
Sekarang perpanjang garis tersebut. OpenAI dan Anthropic masing-masing sudah berada di $1T bahkan sebelum listing.
Jika Anda menjumlahkan debut teknologi terbesar dari 25 tahun terakhir. Alibaba, Facebook, Uber, Rivian, Snowflake, Palantir, Cerebras, CoreWeave, semuanya. Anda mendapatkan sekitar $800Miliar.
OpenAI + Anthropic saja bernilai hampir $2T. Masih swasta. 2,5x lebih besar dari seperempat abad listing terbesar Wall Street, diga

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

05-17 23:37

Sepanjang sebagian besar sejarah, modal berkembang melalui mesin.
Sekarang modal berkembang melalui kognisi.
Sebuah startup dapat bangun dengan setara dengan satu juta analis, peneliti, pengembang, dan ahli strategi yang berjalan secara paralel dengan biaya marginal mendekati nol.
Revolusi AI berbeda dari revolusi teknologi sebelumnya.

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

04-27 21:53

Anda tidak bisa mengangkat dana berdasarkan piagam terbuka dan memperlakukan bagian terbuka sebagai opsional setelah uang muncul
pengadilan dimulai dengan pertanyaan: bisakah Anda mengesahkan sebuah organisasi nirlaba, menyebut misi openai Anda, menarik 10 tahun insinyur yang berorientasi misi dan modal donasi berdasarkan janji itu, lalu mengubahnya menjadi struktur dengan batasan keuntungan dan menyebutnya sebagai evolusi?
elon meninggalkan openai pada 2018. kerusakan yang $130b dia minta dikembalikan ke organisasi nirlaba. apa pun pendapat Anda tentang dia sebagai tergugat, pertanyaan y

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

04-26 21:56

nvidia sekarang lebih besar dari seluruh ekonomi Jepang dan tagihan AI Anda adalah alasannya
setiap dolar yang Anda habiskan untuk AI saat ini melewati satu perusahaan chip, di tiga cloud yang menjualnya kembali dengan markup
> startup AI membakar ~80% dari modal yang mereka kumpulkan hanya untuk menyewa komputasi
> saya pernah melihat tim tahap benih membayar $700k/bulan untuk satu vendor chip
> pusat data berjalan pada kapasitas 12-18% sementara tagihan Anda naik setiap kuartal
seluruh industri baru saja sepakat untuk berdiri dalam satu baris dan menyerahkan uang ke gerbang tol yang sama
ada

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

torygreen

04-23 22:14

kerumunan ai-yang-terlalu-banyak-telah-tidak-pernah-mencoba-membeli-h100-kuartal-ini
menghabiskan seminggu mencoba membeli h100 saat ini berarti: komitmen 12 bulan di aws (pemanfaatan 24/7 terkunci sebelum Anda melihat satu gpu), daftar tunggu gcp tanpa ETA, lambda dan coreweave keduanya habis terjual, setiap penyedia yang lebih kecil memberi Anda jawaban yang sama dengan kata-kata berbeda
konstruksi hyperscaler diukur dalam tahun, kekurangan cpu memperlambat gpu yang ada, dan permintaan terus tumbuh sementara hyperscaler mengajukan izin
tim ai tahap benih menghabiskan 70-80% dari jalur mereka

Lihat Asli

Hadiah
suka
Komentar
Posting ulang
Bagikan

Topik Trending
Lihat Lebih Banyak
#
SKHynixTopsKOSPIByMarketCap
1,61M Popularitas
#
MicronEarningsBeatExpectationsSharesRise
470,88K Popularitas
#
IsraelStrikesIranBTCPlunges
64,42K Popularitas
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
344,25K Popularitas
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
185,54K Popularitas

Disematkan

peta situs

torygreen

Topik Trending

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

Disematkan