Sistem AI Generasi Berikutnya Menjanjikan Skalabilitas yang Belum Pernah Ada Sebelumnya

Mendukung solusi bisnis terpadu seperti AI21 sekaligus mengungguli semua model terkenal di dunia dalam hal produktivitas, Jambo menjadi model pertama yang tersedia dengan metode berbasis Mamba tingkat produksi. Dengan integrasi teknologi Mamba SSM dan elemen arsitektur Transformer lama, Jamba mewakili visi baru dalam merancang model bahasa yang lebih besar (LLM).

Merevolusi LLM

Kemunculan Jamba menunjukkan pergeseran era dalam kasus LLM, yang secara efisien menangani kendala jenis arsitektur SSM dan Transformers biasa. Menjelajah ke dalam konteks ukuran jendela hingga 256K, Jamba terlihat memiliki keunggulan besar dibandingkan model lain di wilayah serupa pada tolok ukur berbeda, sehingga menetapkan standar baru sebagai ukuran efisiensi dan kinerja terbaik.

Arsitektur Jamba memiliki banyak aspek yang menjadikannya sebagai sistem hybrid Transformers, Mambas, dan campuran ahli (MoE) yang bertindak bersama secara sinergi. Integrasi ini mengimplementasikan pengoptimalan pemanfaatan memori bersama dengan throughput, yang merupakan fokus utama tugas bahasa berskala besar, dan mendorong batas performa yang dapat dicapai.

Menjadi scalable adalah DNA Jamba, yang berarti dapat menangani lebih dari 140 ribu konteks hanya dengan menggunakan satu GPU. Skalabilitas ini dapat menjaga operasional dan keterlibatan tetap terjaga, membantu pembelajaran dan eksplorasi, menghasilkan pengetahuan baru, dan mendorong inovasi dalam komunitas AI.

Pencapaian penting

Peluncuran Jamba tidak hanya menandai fenomena yang mengubah keadaan namun juga merupakan langkah maju dalam bidang penelitian LLM. Pertama, ia berhasil menggabungkan arsitektur Mamba dan Transformer sedemikian rupa sehingga keduanya bekerja sama seperti simbiosis, yang kombinasinya ternyata benar-benar lebih kuat daripada masing-masing bagiannya. Selain itu, teks ini memperkenalkan versi SSM-Transformer hybrid yang menggabungkan kekuatan dan kecepatan SSM-Transformer lain yang sudah ada dengan kemampuan untuk bekerja lebih baik dalam konteks baru.

Dagan, bagaimanapun, VP produk di AI21, menyatakan dengan luar biasa dan mempertahankan struktur arsitektur campuran Jamba sebagai yang terdepan. Ia menjelaskan bagaimana kelincahan Jamba memungkinkan pengiriman kasus penggunaan dengan volume besar secara cepat dan mendukung kecepatan real-time, bahkan mempercepat peluncuran kasus penggunaan kritis.

Kolaborasi sumber terbuka

Rilis bobot terbuka Jamba dengan lisensi Apache 2.0 menyiratkan bahwa AI21 dapat menerapkan komisi semacam ini di komunitas sumber terbuka. AI21 berkomitmen untuk menyediakan lingkungan di mana kemajuan baru dapat dikembangkan dengan mendorong kontribusi dan ide lebih lanjut.

Mengenkapsulasi pipeline GPU NVIDIA sebagai layanan mikro inferensi NIM menyederhanakan aksesibilitas Jamba yang mendukung aplikasi perusahaan. Humanisasi: Integrasi tanpa hambatan memungkinkan penerapan yang cepat dan bebas masalah sekaligus meningkatkan aplikasi Jampa di hampir semua skenario sehari-hari.

Peluncuran Jamba oleh AI21 telah menandai tonggak penting dalam bidang AI korporat. Jamba siap untuk mengubah industri model bahasa dengan menawarkan arsitektur hybrid yang inovatif, skalabilitas yang tak tertandingi, dan fitur integrasi model yang luar biasa. Oleh karena itu, ini membekali pelanggan untuk melakukan tugas bahasa yang menantang dengan mudah dan lebih cepat dari sebelumnya.

AI21 juga telah menunjukkan dukungannya terhadap kolaborasi sumber terbuka dan kemitraan bisnis dengan perusahaan AI terkemuka seperti NVIDIA, yang semakin menunjukkan dedikasinya dalam mendorong laju kemajuan teknologi dan meningkatkan penerapan solusi AI yang sangat efisien di berbagai bidang.

Namun, Jamba memastikan posisinya dalam lanskap AI yang lebih luas terkait dengan pemrosesan bahasa; dengan demikian, dampaknya akan terasa jauh melampaui cakupan platform pemrosesan bahasa tradisional untuk mengantarkan tatanan baru solusi bisnis yang didukung AI.

Sumber: https://www.cryptopolitan.com/next-generasi-ai-system-promises/