| word class | golongan kata/kelas kata | Linguistik | Tiada | Golongan kata yang mempunyai kesamaan dari segi bentuk dan/atau fungsi |
| pengetag golongan kata (POS) | part of speech (POS) tagger | Kecerdasan Buatan | Komunikasi | Alkhwarizmi dalam pemprosesan bahasa tabii (NLP) yang melabelkan golongan kata (POS) dalam ayat sesebuah teks secara automatik seperti dalam aplikasi sistem soal jawab dan analisis sentimen. Contoh golongan kata utama dalam bahasa Melayu ialah kata nama, kata kerja, kata adjektif dan kata tugas. Sebagai contoh, bagi ayat �Keluarga saya suka berkelah di tepi pantai Merdeka�, setiap kata akan di tag secara automatik kepada kata dan tag: �keluarga = kata nama, saya = ganti nama, suka, berkelah = kata kerja, �di� = kata tugas, �tepi� = kata adjektif, pantai = kata nama, �Merdeka� = kata nama khas�. Alkhwarizmi yang sering digunakan bagi mengetag golongan kata adalah berasaskan peraturan, kaedah stokastik dan kaedah berasaskan rangkaian neural seperti Model Markov Tersembunyi (HMM), Rangkaian Memori Jangka Pendek Panjang Dwi Arah (Bi-LSTM) dan Transformer. |
| word class | golongan kata/kelas kata | Pendidikan | Tiada | Tiada |
| part of speech | golongan kata | Linguistik | Tiada | Tiada |
| part of speech | golongan kata | Pendidikan | Tiada | Tiada |
| delicacy | kehalusan | Linguistik | Tiada | Dalam tatabahasa sistemik, tahap kerapian analisis fenomena linguistik. Contohnya, analisis golongan kata lebih rapi daripada analisis subjek dan predikat dalam ayat. |
| defective verb | kata kerja cangga | Linguistik | Tiada | Kata kerja yang tidak mempunyai ciri-ciri konjugasi yang lazim terdapat pada golongan kata kerja. Contohnya, kata kerja bantu masih, belum dan akan. |
| pelemaan | lemmatize | Kecerdasan Buatan | Komunikasi | Proses yang mengembalikan sesuatu bentuk kata terbitan kepada kata dasar atau lema dengan merujuk kepada golongan kata dan maklumat korpus yang berkaitan. Sebagai contoh, kata terbitan seperti �persendirian�, �kendiri�, �berdiri�, �menyendiri� dan �tersendiri� boleh dipetakan kepada lema �sendiri� atau �diri� bergantung pada konteks. Kaedah ini digunakan secara meluas dalam analitik teks dan pemprosesan bahasa tabii. Lihat juga pengakaran. |
| dictionary | kamus | Linguistik | Tiada | Senarai butir leksikal, seperti kata, frasa, atau istilah, biasanya disusun mengikut abjad, dalam bentuk buku. Ia menghuraikan maklumat, seperti sebutan, ejaan, etimologi, makna, padanan dalam satu bahasa atau lebih, golongan kata, atau maklumat tatabahasa lain. kamus terbahagi kepada beberapa jenis, seperti kamus ekabahasa, kamus dwibahasa, dan kamus khusus. |
| pengekstrakan fitur | feature extraction | Kecerdasan Buatan | Komunikasi | Proses mengenal pasti dan mengekstrak fitur yang relevan daripada data mentah seperti teks, video, audio dan imej bagi memudahkan pembelajaran mesin. Tujuan utama proses ini ialah mengurangkan dimensi data sambil mengekalkan maklumat penting, sekali gus meningkatkan kecekapan pengkomputeran dan prestasi model. Sebagai contoh, pengekstrakan fitur dalam korpus teks Melayu klasik untuk mengekstrak fitur golongan kata seperti kata nama, kata kerja dan kata adjektif. Jika kita mempunyai ayat �Shuhaida tidur di atas katil�. Kata �Shuhaida� dan �katil� akan diekstrak sebagai fitur kata nama, kata �tidur� sebagai fitur kata kerja, kata �di� sebagai fitur kata hubung dan kata �atas� sebagai fitur kata sendi nama yang relevan digunakan dalam model AI. Contoh alkhwarizmi yang digunakan seperti analisis komponen utama (PCA), frekuensi istilah-frekuensi dokumen songsang (TF-IDF) dan beg kata (BoW). Lihat juga frekuensi istilah-frekuensi dokumen songsang (TF-IDF), beg kata (BoW). |