Internet

Model Bahasa Kecil Baru Buatan Microsoft Mampu Ungguli ChatGPT

Dalam pengujian perbandingan, Phi-1 mencapai skor akurasi 50,6%, melampaui performa GPT-3.5 sebesar 47%.

Cesar Uji Tawakal

Posted: Selasa, 27 Juni 2023 | 14:19 WIB

Microsoft Office. (Microsoft)

Hitekno.com - Dalam terobosan yang mengejutkan, Microsoft telah meluncurkan model bahasa terbaru mereka, Phi-1, dengan 1,3 miliar parameter.

Berbeda dengan kepercayaan konvensional bahwa model yang lebih besar memiliki performa lebih baik, pendekatan Microsoft berfokus pada kualitas data pelatihan.

Dilansir dari Gizmochina, Phi-1, dilatih dengan dataset "tingkat buku teks" yang disusun dengan cermat, telah mengungguli GPT-3.5 dengan 100 miliar parameter.

Model bahasa Phi-1 dari Microsoft, yang dibangun dengan arsitektur Transformer, telah menarik perhatian karena performanya yang mengesankan.

Tim di balik Phi-1 menekankan kualitas data pelatihan, yang berbeda dari tren umum dalam meningkatkan ukuran model.

Dengan menggunakan dataset berkualitas tinggi yang terdiri dari konten "tingkat buku teks" yang diperoleh dari internet, tim Microsoft memproses informasi tersebut menggunakan GPT-3.5. Dengan bantuan 8 GPU Nvidia A100, proses pelatihan selesai dalam waktu empat hari.

Menurut Microsoft, fokus pada peningkatan kualitas data pelatihan, bukan peningkatan jumlah parameter, telah menghasilkan hasil yang menjanjikan.

Dalam pengujian perbandingan, Phi-1 mencapai skor akurasi 50,6%, melampaui performa GPT-3.5 sebesar 47% dengan total 175 miliar parameter yang mencengangkan.

Microsoft berencana untuk membuka sumber daya Phi-1 di HuggingFace, yang akan memperkuat aksesibilitas dan potensi kolaboratif model bahasa ini.

Ini bukanlah kali pertama Microsoft mengembangkan model bahasa yang lebih kecil; sebelumnya, mereka memperkenalkan Orca, model 13 miliar parameter yang dilatih dengan data sintetis menggunakan GPT-4.

Bahkan Orca terbukti mengungguli ChatGPT. Makalah penelitian tentang Phi-1 telah dipublikasikan di arXiv, yang memberikan wawasan detail tentang arsitektur dan metodologi pelatihannya.

Bagi mereka yang tertarik untuk menjelajahi aspek teknis, makalah ini menawarkan gambaran komprehensif tentang perkembangan Phi-1.

Model bahasa Phi-1 dari Microsoft menantang pandangan bahwa peningkatan ukuran model diperlukan untuk performa yang lebih baik.

Dengan berfokus pada data pelatihan berkualitas tinggi, Phi-1 telah menunjukkan akurasi yang luar biasa, bahkan melampaui model yang lebih besar.

Pembukaan sumber daya Phi-1 juga menunjukkan komitmen Microsoft dalam memajukan bidang pemrosesan bahasa alami.

Tag

Berita Terkait

10 Aplikasi Wajib di Ponsel Android untuk Produktivitas Harian

Masa Depan di Depan Mata: Bagaimana AI Akan Mengubah Dunia Kerja di Indonesia?

Masa depan dunia kerja di Indonesia akan dipengaruhi oleh kecerdasan buatan secara drastis. Pelajari bagaimana AI dapat ...

internet | 14:44 WIB

Mengenal Perbedaan AI, Machine Learning, dan Deep Learning dengan Bahasa Sederhana

Pahami perbedaan antara Artificial Intelligence (AI), Machine Learning (ML), dan Deep Learning (DL) dengan penjelasan se...

internet | 08:15 WIB

Adu Hening: Ini Deretan TWS dengan Active Noise Cancellation Terbaik di Bawah 1 Juta Rupiah

Mencari TWS dengan fitur peredam bising (ANC) terbaik di bawah 1 juta? Simak adu hening antara Realme Buds Air 5 Pro, An...

internet | 14:45 WIB

Rekomendasi Laptop 'Ngonten' Terbaik 2025: Dari Desain Grafis hingga Editing Video 4K, Ini Jagoannya!

Cari laptop untuk ngonten di tahun 2025? Simak rekomendasi terbaik untuk desain grafis hingga editing video 4K, dari Mac...

internet | 08:15 WIB

Mau Hemat Beli Elektronik Incaran Pakai Kartu Kredit? Coba Cara Ampuh Ini

Punya rencana buat beli barang elektronik tapi ingin tetap hemat? Wujudkan pakai kartu kredit online saja! Simak tipsnya...

internet | 20:36 WIB

Baca Selengkapnya

3 Cara Memasang Video di PowerPoint, Presentasi Makin Menarik

Gadget

Model Bahasa Kecil Baru Buatan Microsoft Mampu Ungguli ChatGPT

Dalam pengujian perbandingan, Phi-1 mencapai skor akurasi 50,6%, melampaui performa GPT-3.5 sebesar 47%.

10 Aplikasi Wajib di Ponsel Android untuk Produktivitas Harian

Cara Mudah Pakai ChatGPT untuk Selesaikan Tugas Kuliah dan Pekerjaan Sehari-hari

Avanade Perkuat Komitmen Regional, Hadir di Indonesia Dorong Transformasi Digital dengan AI Microsoft

Metode Kompresi LLM Ekstrem Baru: AQLM dan PV-Tuning Kurangi Ukuran Model 8x dengan Mempertahankan Kualitas 95%

Kolaborasi Plan Indonesia dan Microsoft, Luncurkan Program AI TEACH for Indonesia

Masa depan dunia kerja di Indonesia akan dipengaruhi oleh kecerdasan buatan secara drastis. Pelajari bagaimana AI dapat ...

Pahami perbedaan antara Artificial Intelligence (AI), Machine Learning (ML), dan Deep Learning (DL) dengan penjelasan se...

Mencari TWS dengan fitur peredam bising (ANC) terbaik di bawah 1 juta? Simak adu hening antara Realme Buds Air 5 Pro, An...

Cari laptop untuk ngonten di tahun 2025? Simak rekomendasi terbaik untuk desain grafis hingga editing video 4K, dari Mac...

Punya rencana buat beli barang elektronik tapi ingin tetap hemat? Wujudkan pakai kartu kredit online saja! Simak tipsnya...

Baca Selengkapnya

3 Cara Memasang Video di PowerPoint, Presentasi Makin Menarik

Duel Sengit HP Samsung 2 Jutaan di 2025: Pilih Jaringan 5G Cepat atau Spek 4G Lebih Mewah?

Adu Spek Sengit HP Ngonten Infinix 2 Jutaan, Pilih Detail Foto, Raja Vlog, atau Video Anti Goyang?

Alter Ego Lolos Grand Final PMWC 2025 PUBG Mobile, Raih Hadiah Rp 1,2 Miliar

Polytron Ramaikan Pasar Laptop Indonesia, Pertama Kalinya Setelah 50 Tahun Berdiri

Rekomendasi HP Infinix dengan NFC Juli 2024, Mulai Rp1 Jutaan Hingga Jagoan Konten