Sun-Temple-Baanner

ગુજરાતી આર્ટિફિશિયલ ઇન્ટેલિજન્સઃ દિલ્હી દૂર છે, પણ સફર મધુર છે (Part 1)


Post Published by


Post Published on


Post Categories


,

Search Your Query


Explore Content


Reach Us


Drop a Mail

hello@sarjak.org

Donate Us


Help us to enrich more with just a Cup of Coffee

Be a Sarjak


ગુજરાતી આર્ટિફિશિયલ ઇન્ટેલિજન્સઃ દિલ્હી દૂર છે, પણ સફર મધુર છે (Part 1)


ગુજરાતી આર્ટિફિશિયલ ઇન્ટેલિજન્સઃ દિલ્હી દૂર છે, પણ સફર મધુર છે (Part 1)

———-

‘ઓહ, આઈ ડાઇડ લાફિંગ…’ આ વાક્યનો ગુજરાતી અનુવાદ ‘ઓહ, હસતાં હસતાં મારૃં મૃત્યુ થયું’ એમ ન થાય. આ અંગ્રેજી વાક્યનો ગુજરાતી ભાવાનુવાદ ‘ઓહ, હસતાં હસતાં મારા પેટમાં દુખવા લાગ્યું’ એવો થવો જોઈએ. આર્ટિફિશિયલ ઇન્ટેલિજન્સથી સજ્જ સિસ્ટમ ગુજરાતી કે કોઈ પણ પ્રાદેશિક ભાષાને પ્રોસેસ કરતી વખતે જે-તે ભાષાની છટાઓ, સૂક્ષ્મતાઓ અને વિરોધિતાઓને બરાબર સમજે તે અનિવાર્ય છે…

——————————
વાત-વિચાર – એડિટ પેજ – ગુજરાત સમાચાર
——————————

ચેટજીપીટીનો ધમાકેદાર પ્રવેશ થયો ને તે સાથે આખી દુનિયાના મોઢે આ બે શબ્દો ચડી ગયા – આર્ટિફિશિયલ ઇન્ટેલિજન્સ (AI). આ ક્ષેત્રમાં આમ તો દાયકાઓથી કામ થઈ રહ્યું છે, પણ સમજોને કે તે આમઆદમી પાસે નક્કર રીતે છેલ્લાં દોઢ-પોણાબે વર્ષ દરમિયાન પહોંચ્યું છે. ચેટજીપીટી, જેમિની જેવાં AI ટૂલ્સ આજે આપણે છૂટથી વાપરતા થઈ ગયા છીએ. હવે તો વોટ્સએપ પણ ‘મેટા એઆઇ’ વડે સુસજ્જ છે. કંઈ પણ જાણવું હોય તો આપણે ફટાક્ કરતાં વોટસેએપ પર જઈને મેટા એઆઇ સાથે ચેટિંગ કરી કરી શકીએ છીએ. ફરિયાદ આ છેઃ ચેટજીપીટી અને મેટા એઆઈ પ્રકારનાં ટૂલ્સ, AI વડે સજ્જ ઉપકરણો ને એપ્લિકેશન્સ માત્ર અંગ્રેજીમાં જ હોય તે કેમ ચાલે? આપણી ગુજરાતી ભાષાએ શો ગુનો કર્યો છે? જવાબ એ છે કે ગુજરાતી ભાષાએ કોઈ ગુનો કર્યો નથી. આર્ટિફિશિયલ ઇન્ટેલિજન્સ અને ગુજરાતી ભાષાનું મધુર મિલન લાંબા સમયથી આકાર લઈ રહ્યું છે.

થોડા સમય પહેલાં સરદાર વલ્લભભાઈ ઇન્સ્ટિટયુટ ઓફ ટેકનોલોજી (એસવીઆઇટી)-વાસદ અને ગુજરાત સાહિત્ય અકાદમીએ સંયુક્તપણે ‘ડેવલપમેન્ટ એન્ડ એક્સપાન્શન ઓફ ગુજરાતી લેંગ્વેજ કમ્પ્યુટેશનલ ટૂલ્સ થૂ્ર AI/NLP એપ્લિકેશન્સ’ વિષય પર એક રાષ્ટ્રીય પરિસંવાદનું આયોજન કર્યું હતું. આ સેમિનારના આયોજન સાથે સક્રિયપણે સંકળાયેલા પ્રોફેસર બ્રિજેશ પંચાલ કહે છે, ‘આર્ટિફિશિયલ ઇન્ટેલિજન્સમાં ગુજરાતી ભાષાના પ્રયોગની વાત કરીએ તો હજુ આપણે પા-પા પગલી ભરી રહ્યા છીએ એમ કહી શકાય. ઇન ફેક્ટ, ભારતની લગભગ તમામ પ્રાદેશિક ભાષાઓની આ જ સ્થિતિ છે. હિન્દી ઉપરાંત તમિળમાં પ્રમાણમાં થોડુંક વધારે કામ થયું છે. તેનું મુખ્ય કારણ કદાચ એ હોઈ શકે કે અમેરિકામાં કાર્યરત કમ્પ્યુટર એન્જિનીયરોમાં તમિળભાષીઓનું પ્રમાણ સારું એવું છે.’

એસવીઆઇટીના કમ્પ્યુટર સાયન્સ ડિપાર્ટમેન્ટમાં આસિસ્ટન્ટ પ્રોફેસર તરીકે કાર્યરત બ્રિજેશ પંચાલમાં એક ઉત્તમ કોમ્બિનેશન થયું છે. તેઓ ઉત્સાહી રિસર્ચર પણ છે અને સાથે સાથે ગુજરાતી કવિ ને લેખક પણ છે. આ સેમિનારમાં લોકભારતી સણોસરા યુનિવર્સિટી પ્રો-વાઇસ ચાન્સેલર વિશાલ ભાદાણીએ પોતાના પ્રેઝન્ટેશન દરમિયાન કહેલું કે, ‘દુનિયાભરમાં હાલ આશરે સાત હજાર જેટલી બોલીઓ (સ્પોકન લેંગ્વેજીસ) છે, જેમાંથી ફક્ત ૨૦ ભાષાઓ હાઇ રિસોર્સ લેંગ્વેજીસ (એચઆરએલ) છે, જ્યારે બાકીની બધી લૉ રિસોર્સ લેંગ્વેજીસ (એલઆરલએલ) છે. આર્ટિફિશિયલ ઇન્ટેલિજન્સના સંદર્ભમાં આપણી ગુજરાતી ભાષા હાલ લૉ રિસોર્સ લેંગ્વેજ ગણાય. સવાલ એ છે કે આપણે ગુજરાતીને હાઇ રિસોર્સ લેંગ્વેજ શી રીતે બનાવી શકીશું?’

વડોદરાની મહારાજા સયાજીરાવ યુનિવર્સિટીના કમ્પ્યુટર સાયન્સ એન્જિનીયરિંગ ડિપાર્ટમેન્ટના હેડ પ્રોફેસર ડૉ. અપૂર્વ શાહ આર્ટિફિશિયલ ઇન્ટેલિજન્સના પૂરજેપૂરજા છુટ્ટા પાડીને કહે છે, ‘AI એટલે કમ્પ્યુટર સાયન્સ, કોગ્નિટિવ સાયન્સ (મનુષ્યના મન અને દિમાગ – માઇન્ડ અને બ્રેઇનનો અભ્યાસ), સાઇકોલોજી, ફિલોસોફી, લિંગ્વિસ્ટીક્સ (ભાષાવિજ્ઞાાન) અને ન્યુરોસાયન્સનું મિશ્રણ… અન એઆઇના પાયામાં આ ત્રણ ગાણિતીક તત્ત્વો છે – કમ્પ્યુટેશન, લોજિક અને પ્રોબેબિલિટી.’

ભારતમાં સ્માર્ટફોન વાપરનારાઓની સંખ્યા 65 કરોડના આંકડાને ક્યારની પાર કરી ગઈ છે. આમાંના કેટલાય સ્માર્ટફોનધારકો એવા છે જેમને અંગ્રેજીમાં બોલતાં ભલે ન ફાવતું હોય, પણ પોતાની માતૃભાષામાં તેઓ સરસ રીતે કમ્યુનિકટ કરી શકે છે. આ વર્ગ માટે એવાં AI સ્પીચ એન્જિન ટૂલની જરૃર હોવાની કે જેમાં ભારતીયો પોતાની માતૃભાષામાં બોલીને વોઇસ એપ્લિકેશન્સ સાથે ઇન્ટરેક્ટ કરી શકે. વ્યાવહારિક સ્તરે કમ્પ્યુટર માણસ કરતાં વધારે બુદ્ધિશાળી છે, તે માણસના મગજ કરતાં વધારે ડેટા સંગ્રહી શકે છે અને તેને ઉપયોગમાં મૂકી શકે છે, તેની કમ્પ્યુટેશનલ સ્પીડ માણસ કરતાં અનેકગણી વધારે છે એવું આપણે સ્વીકારી લીધું છે. તેથી આપણે કમ્પ્યુટર સાથે મૌખિક કે લિખિત રીતે ‘વાત’ કરતાં હોઈએ ત્યારે આપણને અપેક્ષા હોય છે કે આપણે જે કંઈ બોલીએ છીએ કે ટાઇપ કરીએ છીએ તે બધું જ કમ્પ્યુટર સાચેસાચું અને વધારે સારી રીતે સમજે. મોટા ભાગના ગુજરાતીઓ સ-શ-ષ આ ત્રણ અક્ષરોના શુદ્ધ ઉચ્ચારણ કરતા નથી. છતાંય હું મારી રોજિંદી બોલીમાં કહું કે ‘મહેસ અને સીતલનાં લગ્ન થયાં’ તો પણ ઇન્ટેલિજન્ટ કમ્પ્યુટરને ખબર પડી જવી જોઈએ કે હું ખરેખર ‘મહેશ અને શીતલ’ વિશે વાત કરી રહ્યો છું. તમે ‘તોતેર’ બોલો, ‘તોંતેર’ બોલો કે ‘ત્યોંતેર’ બોલો, કમ્પ્યુટર ખબર પડી જવી જોઈએ કે તમારા કહેવાનો મતલબ ૭૩ છે. તમે ‘સાઠ’, ‘સાંઠ’ કે ‘સાંઇઠ’ કંઈ પણ બોલો, કમ્પ્યુટરે તો ૬૦ જ સમજવાનું છે. આનો સાદો અર્થ એ થયો કે ગુજરાતી બોલનારની લઢણ કોઈ પણ હોય – કાઠિયાવાડી, અમદાવાદી, સુરતી, મહેસાણી, કોઈ પણ – કમ્પ્યુટરે કન્ફ્યુઝ નહીં થવાનું ને સાચો જ જવાબ આપવાનો!

આ આપણી મૂળભૂત અપેક્ષા છે, ગુજરાતી AI ટેકનોલોજી પાસેથી. આપણે એવુંય ઇચ્છીએ છીએ કે આપણે બંગાળી, તેલુગુ, ફ્રેન્ચ, ઇટાલિયન કે કોઈ પણ ભાષાનું લખાણ યા ઓડિયો ક્લિપ AI ટેકનોલોજીથી સુસજ્જ કમ્પ્યુટરમાં ફીડ કરીએ તો તરત જ, રીઅલ ટાઇમમાં, સહેજ પણ ભૂલ વગરનો ગુજરાતી અનુવાદ આપણને મળી જાય. એવું જ એનાથી ઊલટું પણ થવું જોઈએ. ગુજરાતી ભાષામાંથી અન્ય કોઈ પણ ભાષામાં પટ્ પટ્ પટ્ કરતો રિવર્સ – અને ટકોરાબંધ – અનુવાદ થઈ જાય તો કેવી મજા પડે.

ભાષાઓની પોતાની આગવી છટા, આગવો વૈભવ હોય છે. કમ્પ્યુટરનું આર્ટિફિશિયલ ઇન્ટેલિજન્સ જ્યારે ભાષાને પ્રોસેસ કરે ત્યારે તે જે-તે ભાષાની સૂક્ષ્મતાઓને, વિરોધિતાઓ અને પ્રતીકાત્મકતાને પણ સમજે તે જરૃરી છે. એક ઉદાહરણ લઈએ. કોઈ મા પોતાના દીકરાનાં તોફાનોથી ત્રાસીને ધારો કે એવું બોલે છે કે, ‘બસ બહુ થયું… મારું લોહી ન પી.’ અહીં ‘લોહી પીવું’ તે એક રૃઢિપ્રયોગ છે. લોહી પીવાની ક્રિયાને કંઈ શબ્દશઃ લેવાની ન હોય.

આર્ટિફિશિયલ ઇન્ટેલિજન્ટ સિસ્ટમને તેની ખબર હોવી જોઈએ. એટલે જો મમ્મીના આ ઉદ્ગારનો ‘ઇનફ… ડોન્ટ સક માય બ્લડ’ એવો અંગ્રેજી અનુવાદ થાય તો સિસ્ટમ ઇન્ટેલિજન્ટ નહીં, ઇડિયટ લાગે. એ જ રીતે અંગ્રેજીમાં એવું વાક્ય હોય કે ‘ઓહ, આઈ ડાઇડ લાફિંગ…’ તો એનો ગુજરાતી અનુવાદ એવો ન થવો જોઈએ કે ‘ઓહ, હસતાં હસતાં મારૃં મૃત્યુ થયું.’ આ અંગ્રેજી વાક્યનો ગુજરાતી અનુવાદ નહીં, પણ ભાવાનુવાદ ‘ઓહ, હસતાં હસતાં મારા પેટમાં દુખવા લાગ્યું’ એવો થવો જોઈએ. આર્ટિફિશિયલ ઇન્ટેલિજન્ટ સિસ્ટમ એટલી હદે સુસજ્જ હોવી જોઈએ કે એને જે-તે ભાષાના અપશબ્દોની પણ પાક્કી ખબર હોય. જો આપણને નબળું, વિચિત્ર ગૂગલ ટ્રાન્સલેશન પણ ચલાવી લેતા ન હોઈએ તો આર્ટિફિશિયલ ઇન્ટેલિજન્સ ટેક્નોલોજીથી સજ્જ એપ કે ટૂલ પાસેથી કાચુંપાકું ટ્રાન્સલેશન શા માટે ચલાવી લઈએ?

ગુજરાતી આર્ટિફિશિયલ ઇન્ટેલિજન્સની વાત કરીએ તો પ્રણવ મિસ્ત્રીની ટુ એઆઇ (TWO AI) કંપની દ્વારા લોન્ચ થયેલા ચેટસૂત્ર (ChatSUTRA)ને અજમાવવા જેવું છે. પ્લેસ્ટોર પરથી આ એપ આસાનીથી ડાઉનલોડ થઈ જશે. ચેટજીપીટી પ્રકારની આ AI એપ છે, જે તમે ગુજરાતીમાં પૂછેલા સવાલોના શુદ્ધ ગુજરાતીમાં જવાબો આપે છે. અલબત્ત, હજુ ચેટસૂત્રના ગુજરાતી વર્ઝનમાં પરફેક્શન આવતાં ઘણી વાર લાગવાની છે, પણ આ સાચી દિશામાં થયેલો ઉત્તમ પ્રયાસ છે એ તો નક્કી. ભારતનું નેશનલ AI પોર્ટલ INDIAai પણ આ દિશામાં નક્કરપણે આગળ વધી રહ્યું છે. ગુજરાતી ઉપરાંત એકાધિક ભારતીય ભાષાઓમાં અહીં સમાંતરે કામ થઈ રહ્યું છે.

ભાષાઓના સંદર્ભમાં આર્ટિફિશિયલ ઇન્ટેલિજન્સની વાત ચાલતી હોય ને NLP (નેચરલ લેંગ્વેજ પ્રોસેસિંગ) તથા મશીન લર્નિંગની ચર્ચા ન કરીએ તે કેમ ચાલે? તેના વિશે હવે પછી વાત કરીશું.

– શિશિર રામાવત

#vaatvichar #AI #gujarati #vernacularai #GujaratiSamachar

DISCLAIMER


All the rights of Published Content is fully reserved by the respective Owner / Writer. Sarjak.org never taking the ownership of the content, we are just a Platform to publish content to serve the readers. Any Dispute or Query related Content on Platform, Do inform Us at bellow links First. We will Respect, take care of it and Try to Solve it Out as fast as Possible.

Please Do Not Copy the Content, Without Prior Written Permission of there Respective Owner.

Leave a Reply

Your email address will not be published. Required fields are marked *

Copying, distributing, or sharing our content without permission is strictly prohibited. All content on this website is sole property of Respective owners. If you would like to use any of our content, please contact us for permission. Thank you for respecting our work.