MKU- RUSA sponsored National Training Workshop on Language Technology for Tamil - மொழித்தொழில்நுட்பம்

MKU- RUSA sponsored National Training Workshop on Language Technology for Tamil during 22-24 March, 2022,Department of Linguistics,Madurai Kamaraj University,Madurai.

மதுரை காமராசர் பல்கலைக்கழக மொழியியல் துறையில் தமிழுக்கான மொழித் தொழில் நுட்பம் என்ற பயிலரங்கம் மார்ச் 22 -24 வரை நடைபெற்றது. இப்பயிலங்கில் மொழியியல் துறைப் பேராசிரியர்கள கலந்துகொண்டு பல்வேறு தலைப்புகளில் மொழித்தொழில் நுட்பம் குறித்து உரை வழங்கினார்கள்.

பேரா. எல். இராமமூர்த்தி

நிரலாளர் முனைவர் இரா.அகிலன்

பேராசிரியர் திருமதி ரேணுகாதேவி

நிகழ்வின் ஒருங்கினைப்பாளர் முனைவர் கா.உமாராஜ்

மொழியியல் துறைத்தலைவர் பேரா.முனியன், முனைவர் க.பசும்பொன், பேரா.கி.கருணாகரன்

எல் இராமமூர்த்தி அவர்களிடம் நான் எழுதிய இந்திய உயர்கல்வி நிறுவனங்களில் இணையவழிக் கல்வி என்ற நூலை வழங்கியபோது

இணையத்தமிழ் ஆய்வாளர் முனைவர் துரை.மணிகண்டன் பேச்சுத் தொழில்நுட்பம் (speech technology) என்ற தலைப்பில் வழங்கிய உரையில்

இணையத்தமிழ் ஆய்வாளர் துரை.மணிகண்டன்

பேச்சுத் தொழில்நுட்பம் என்றால் என்ன?

பேச்சுத் தொழில்நுட்பம் என்பது ஒரு வகையான கணினி தொழில்நுட்பமாகும், இது ஒரு மின்னணு சாதனத்தை பேசும் வார்த்தை அல்லது ஆடியோவை அடையாளம் காணவும், பகுப்பாய்வு செய்யவும் மற்றும் புரிந்துகொள்ளவும் உதவுகிறது.

இது பொதுவாக டிஜிட்டல் ஒலி சமிக்ஞைகளை உள்ளீடு செய்வதன் மூலமும், சேமிக்கப்பட்ட வடிவங்களின் நூலகத்துடன் அதன் வடிவத்தை பொருத்துவதன் மூலமும் செய்யப்படுகிறது.

எவ்வாறு பேச்சுத்தொழில்நுட்பம் செயல்படுகிறது?

machine learning - artificial intelligence

frequency – அதிர்வெண்

voice technology

பேச்சு தொழில்நுட்பம் தொடர்பு செயலாக்கம் மற்றும் இயந்திர கற்றல் ஆகிய கருத்துகளை சார்ந்துள்ளது. பேச்சாளரின் பண்புகள், பின்னணி இரைச்சல் மற்றும் அதிர்வெண் போன்ற தொடர்புடைய தகவலைப் பேச்சிலிருந்து பிரித்தெடுக்க சமிக்ஞை செயலாக்கம் பயன்படுத்தப்படுகிறது.

தானியங்கி பதிலைத் திரும்பப் பெறுவது போன்ற விரும்பிய வெளியீட்டைச் செய்ய பேச்சு சமிக்ஞைகளை அடையாளம் காணவும் பகுப்பாய்வு செய்யவும் இயந்திர கற்றல் இந்த கேட்கும் சாதனங்களுக்குப் பயன்படுத்தப்படுகிறது.

பேச்சுத்தொழில்நுட்பத்தின் துணைத் துறைகளாக,

1. speech recognition

2. speech verification

3. real-time speech to text conversion

interactive voice response (IVR)
speech synthesis
speech analytics

போன்றவையும் சிறப்பாக கூறலாம்.

பேச்சுத் தொழில்நுட்பத்தை யாரெல்லாம் பயன்படுத்துகிறார்கள்?

பேச்சு தொழில்நுட்பம் மற்றும் ஒலி வெளியீடு (ஸ்பீக்கர்) சரிபார்ப்பு தளங்கள், சட்ட அமலாக்க நடைமுறைகள் மற்றும் செயல்முறைகளில் ஒரு நபரின் குரலை அடையாளம் கண்டு சரிபார்க்க பயன்படுகிறது.

வாடிக்கையாளரின் சேவை மற்றும் ஆதரவை சீரமைக்க நிறுவனங்கள் உரைக்கு உரை மற்றும் IVR (interactive voice response) செயல்பாடுகள் போன்ற பேச்சு தொழில்நுட்பத்தைப் பயன்படுத்த முடியும்.

பார்வைக் குறைபாடு அல்லது காது கேளாத நோயாளிகளுக்கு உதவ, சுகாதார வழங்குநர்கள் பேச்சு தொழில்நுட்ப சாதனங்களைப் பயன்படுத்தலாம். .

சிரி, கூகுள் ஹோம் மற்றும் அமேசான் அலெக்சா போன்ற தனிப்பட்ட பயன்பாட்டு குரல் உதவியாளர்கள் தனிப்பட்ட பேச்சு தொழில்நுட்ப அனுபவங்களை வழங்கும் சாதனங்கள்.

பேச்சு தொழில்நுட்ப வல்லுநர்கள், பேச்சுப் பொறியாளர்கள் மற்றும் பேச்சு நோயியல் வல்லுநர்கள் உள்ளிட்ட பல்வேறு தொழில்கள், மாதிரி விகிதம், சத்தம் விகிதத்திற்கு சமிக்ஞை மற்றும் பண்பேற்றம் போன்ற தொழில்நுட்ப ஒலிக் (ஆடியோ) கூறுகளைச் சேகரிக்க பேச்சு தொழில்நுட்பத்தைப் பெரிதும் நம்பியுள்ளன.

நிகழ்வில் கலந்துகொண்ட மாணவர்கள் மற்றும் பேராசிரியர்கள்

உரை ஒலி – Text to speech

கோப்புகளைத் தமிழில் படித்துக்காட்டும் இணையவழி மென்பொருள்கள் இன்று அதிகமாக உருவாக்கி வெளியிடப்பட்டுப் பயன்பாடுத்தப்படுகின்றன. அவைமுறையே

https://inforobo.com/text-to-speech-online

https://www.googletexttospeech.com/p/tamil-text-to-speech-online-mp3.html

என்றும் திறந்த மூல மென்பொருளாகவும் கிடைக்கின்றன. அவை முறையே

https://www.indiadict.com/web/text-to-speech.html

Text To Speech Free
TTSFree.com

https://ttsfree.com/ இவைகளும் கிடைக்கின்றன.

Top Open Source Speech Recognition Systems என்ற அடிப்படையில் முதல் பத்து இடங்களை பெற்றவையாக

1. Project DeepSpeech (This project is made by Mozilla, the organization behind the Firefox browser.)

2. Kaldi (Apache public license.)

3. Julius (1991 at the University of Kyoto, )

4. Wav2Letter++ (Facebook’s AI Research Team just 2 months ago.)

5. DeepSpeech2 (Chinese giant Baidu are also working on their own speech-to-text engine,)

6. OpenSeq2Seq (Developed by NVIDIA for sequence-to-sequence models training.)

7. Fairseq (Developed by Facebook and written in Python and the PyTorch framework.)

8. Vosk

9. Athena (TensorFlow.)

10. ESPnet -

Simon James என்ற ஆய்வாளர் தனது ஆய்வுக்கட்டுரையில் குறிப்பிட்டுள்ளார்

தமிழில் பேசுவதை எழுதும் பேச்சுத் தொழில்நுட்பத்தையும் உருவாக்கி வெளிவந்துள்ளது. அவை முறையே

1. https://speechnotes.co

இவ்வாறக தமிழில் பேச்சுத்தொழில் நுட்பம் பல கட்டங்களாக இன்று வளர்ந்து வந்திருப்பது தொழில்நுட்பத்தில் தமிழ்மொழியின் வளர்ச்சியைக் காட்டுகிறது என்று தனது உரையில் குறிப்பிட்டுப் பேசியுள்ளார்.