Hanya ilustrasi, Otak Sebuah Chip Antara Nvidia dan Huawei
Teknosarena - Dalam dunia AI, chip bukan sekadar lempengan silikon. Mereka adalah orkestra yang sangat kompleks. NVIDIA selama ini dianggap sebagai konduktor terbaik di dunia, namun Huawei dengan arsitektur Da Vinci-nya mulai menawarkan simfoni yang berbeda. Mari kita preteli satu per satu perbedaannya.
Filosofi Inti: GPU vs. NPU, NVIDIA pada dasarnya adalah GPU (Graphics Processing Unit). Sejarahnya dimulai dari kartu grafis untuk gaming. Karena itulah, arsitektur NVIDIA (seperti Hopper atau Blackwell) sangat mahir dalam melakukan ribuan tugas kecil secara bersamaan. Ibaratnya, NVIDIA adalah pasukan semut yang sangat disiplin dan berjumlah jutaan.
Sedangkan Huawei Ascend menggunakan arsitektur yang mereka sebut Da Vinci. Berbeda dengan NVIDIA, ini adalah NPU (Neural Processing Unit) yang dirancang khusus dari nol hanya untuk satu tujuan: kecerdasan buatan. Huawei menggunakan apa yang disebut dengan 3D Cube Core. Jika NVIDIA adalah pasukan semut, Huawei adalah sekumpulan alat berat yang dirancang khusus untuk memindahkan blok-blok data raksasa (matriks) dalam sekali ayun. Untuk tugas AI tertentu, pendekatan Huawei ini secara teoritis bisa lebih efisien.
Sebuah Pertempuran Memori, Siapa yang Lebih Cepat "Lupa"?, Dalam melatih AI, kecepatan prosesor tidak ada artinya jika memori (RAM) tidak bisa mengimbanginya. Di sinilah letak keunggulan mutlak NVIDIA selama ini dengan teknologi HBM (High Bandwidth Memory).
Chip NVIDIA H100 atau H200 memiliki jalur data yang sangat lebar, memungkinkan data mengalir tanpa hambatan (bottleneck). Huawei sebenarnya menggunakan teknologi serupa pada Ascend 910B/C, namun tantangan mereka ada pada interkoneksi. NVIDIA punya NVLink, sebuah "jalan tol" super cepat yang menghubungkan ribuan chip menjadi satu kesatuan raksasa. Huawei punya RoCE (RDMA over Converged Ethernet), namun dalam skala ribuan chip, "jalan tol" milik NVIDIA masih terasa lebih mulus dan minim kemacetan dibandingkan solusi Huawei.
Ekosistem Software: Tembok Tebal bernama CUDA, Inilah bagian yang paling membuat pusing insinyur ByteDance. NVIDIA punya CUDA. Selama lebih dari 15 tahun, pengembang AI di seluruh dunia menulis kode mereka menggunakan bahasa CUDA. Ini adalah ekosistem yang sudah sangat matang; jika ada masalah, solusinya biasanya sudah tersedia di internet.
Huawei hadir dengan CANN (Compute Architecture for Neural Networks). Meskipun Huawei sudah menyediakan alat untuk "menerjemahkan" kode CUDA ke CANN secara otomatis, kenyataannya tidak pernah semudah itu. Bayangkan Anda mencoba menerjemahkan puisi dari bahasa Indonesia ke bahasa Finlandia menggunakan mesin penerjemah. Maknanya mungkin sampai, tapi "rasa" dan efisiensinya seringkali hilang. Insinyur ByteDance harus melakukan optimasi manual agar chip Huawei bisa berlari sekencang NVIDIA, dan itu memakan waktu serta biaya yang tidak sedikit.
Presisi dan Efisiensi Daya, Salah satu rahasia NVIDIA tetap dominan adalah kemampuannya memproses data dengan berbagai tingkat presisi (seperti FP8 atau INT8). Semakin rendah presisinya, semakin cepat prosesnya dan semakin hemat listriknya, tanpa mengurangi kecerdasan AI secara drastis.
Huawei Ascend 910C telah mengejar ketertinggalan ini dengan sangat baik. Mereka mengoptimalkan komputasi matriks pada level perangkat keras sehingga untuk tugas-tugas inference (menjalankan AI yang sudah jadi), chip Huawei seringkali tampil sangat kompetitif. Namun, untuk tugas training (membangun AI dari nol), NVIDIA masih unggul karena kemampuannya menangani perhitungan matematika yang jauh lebih rumit dengan stabilitas yang lebih tinggi.
Masalah Produksi: Faktor Fabrikasi, Ini adalah perbedaan teknis yang bukan berasal dari desain, tapi dari cara pembuatan. NVIDIA menggunakan jasa TSMC dengan teknologi 4 nanometer atau bahkan 3 nanometer yang sangat canggih. Semakin kecil nanometernya, semakin banyak transistor yang bisa dijejalkan, dan semakin hemat energinya.
Huawei, karena sanksi, harus mengandalkan pabrikan domestik seperti SMIC. Akibatnya, chip Huawei cenderung lebih besar, lebih cepat panas, dan mengonsumsi daya lebih banyak untuk menghasilkan performa yang setara dengan NVIDIA. Bagi ByteDance, ini berarti mereka harus mengeluarkan uang lebih banyak untuk biaya listrik dan sistem pendingin di pusat data mereka.
Mengejar Ketertinggalan, Secara teknis, Huawei tidak sedang mencoba "meniru" NVIDIA. Mereka membangun jalur yang berbeda dengan arsitektur NPU Da Vinci yang sangat kuat pada pengolahan matriks. Masalah terbesar Huawei saat ini bukan pada kecerdasan desainnya, melainkan pada kematangan ekosistem perangkat lunak (software) dan keterbatasan teknologi manufaktur.
Bagi ByteDance, menggunakan Huawei adalah investasi jangka panjang. Mereka bertaruh bahwa seiring berjalannya waktu, ekosistem CANN akan semakin matang dan optimasi perangkat lunak akan menutup celah performa perangkat keras. Ini adalah perlombaan antara kemapanan (NVIDIA) melawan ketangguhan dalam keterbatasan (Huawei).
