MKU-
RUSA sponsored National Training Workshop on Language Technology for Tamil
during 22-24 March, 2022,Department of Linguistics,Madurai Kamaraj
University,Madurai.
மதுரை
காமராசர் பல்கலைக்கழக மொழியியல் துறையில் தமிழுக்கான மொழித் தொழில் நுட்பம் என்ற பயிலரங்கம் மார்ச் 22 -24 வரை நடைபெற்றது. இப்பயிலங்கில்
மொழியியல் துறைப் பேராசிரியர்கள கலந்துகொண்டு பல்வேறு தலைப்புகளில் மொழித்தொழில் நுட்பம்
குறித்து உரை வழங்கினார்கள்.
எல் இராமமூர்த்தி அவர்களிடம் நான் எழுதிய இந்திய உயர்கல்வி நிறுவனங்களில் இணையவழிக் கல்வி என்ற நூலை வழங்கியபோது
இணையத்தமிழ் ஆய்வாளர் முனைவர் துரை.மணிகண்டன் பேச்சுத் தொழில்நுட்பம் (speech technology) என்ற தலைப்பில் வழங்கிய உரையில்
இணையத்தமிழ் ஆய்வாளர் துரை.மணிகண்டன்
பேச்சுத் தொழில்நுட்பம் என்றால் என்ன?
பேச்சுத் தொழில்நுட்பம் என்பது ஒரு வகையான கணினி தொழில்நுட்பமாகும், இது ஒரு மின்னணு சாதனத்தை பேசும் வார்த்தை அல்லது ஆடியோவை அடையாளம் காணவும், பகுப்பாய்வு செய்யவும் மற்றும் புரிந்துகொள்ளவும் உதவுகிறது.
இது பொதுவாக டிஜிட்டல் ஒலி சமிக்ஞைகளை உள்ளீடு செய்வதன் மூலமும், சேமிக்கப்பட்ட வடிவங்களின் நூலகத்துடன் அதன் வடிவத்தை பொருத்துவதன் மூலமும் செய்யப்படுகிறது.
எவ்வாறு பேச்சுத்தொழில்நுட்பம் செயல்படுகிறது?
machine learning - artificial intelligence
frequency – அதிர்வெண்
பேச்சு தொழில்நுட்பம் தொடர்பு செயலாக்கம் மற்றும் இயந்திர கற்றல் ஆகிய கருத்துகளை சார்ந்துள்ளது. பேச்சாளரின் பண்புகள், பின்னணி இரைச்சல் மற்றும் அதிர்வெண் போன்ற தொடர்புடைய தகவலைப் பேச்சிலிருந்து பிரித்தெடுக்க சமிக்ஞை செயலாக்கம் பயன்படுத்தப்படுகிறது.
தானியங்கி பதிலைத் திரும்பப் பெறுவது போன்ற விரும்பிய வெளியீட்டைச் செய்ய பேச்சு சமிக்ஞைகளை அடையாளம் காணவும் பகுப்பாய்வு செய்யவும் இயந்திர கற்றல் இந்த கேட்கும் சாதனங்களுக்குப் பயன்படுத்தப்படுகிறது.
பேச்சுத்தொழில்நுட்பத்தின் துணைத் துறைகளாக,
2. speech verification
3. real-time speech to text conversion
- interactive voice response (IVR)
- speech synthesis
- speech analytics
போன்றவையும் சிறப்பாக கூறலாம்.
பேச்சுத் தொழில்நுட்பத்தை யாரெல்லாம் பயன்படுத்துகிறார்கள்?
பேச்சு தொழில்நுட்பம் மற்றும் ஒலி வெளியீடு (ஸ்பீக்கர்) சரிபார்ப்பு தளங்கள், சட்ட அமலாக்க நடைமுறைகள் மற்றும் செயல்முறைகளில் ஒரு நபரின் குரலை அடையாளம் கண்டு சரிபார்க்க பயன்படுகிறது.
வாடிக்கையாளரின் சேவை மற்றும் ஆதரவை சீரமைக்க நிறுவனங்கள் உரைக்கு உரை மற்றும் IVR (interactive voice response) செயல்பாடுகள் போன்ற பேச்சு தொழில்நுட்பத்தைப் பயன்படுத்த முடியும்.
பார்வைக் குறைபாடு அல்லது காது கேளாத நோயாளிகளுக்கு உதவ, சுகாதார வழங்குநர்கள் பேச்சு தொழில்நுட்ப சாதனங்களைப் பயன்படுத்தலாம். .
சிரி, கூகுள் ஹோம் மற்றும் அமேசான் அலெக்சா போன்ற தனிப்பட்ட பயன்பாட்டு குரல் உதவியாளர்கள் தனிப்பட்ட பேச்சு தொழில்நுட்ப அனுபவங்களை வழங்கும் சாதனங்கள்.
பேச்சு தொழில்நுட்ப வல்லுநர்கள், பேச்சுப் பொறியாளர்கள் மற்றும் பேச்சு நோயியல் வல்லுநர்கள் உள்ளிட்ட பல்வேறு தொழில்கள், மாதிரி விகிதம், சத்தம் விகிதத்திற்கு சமிக்ஞை மற்றும் பண்பேற்றம் போன்ற தொழில்நுட்ப ஒலிக் (ஆடியோ) கூறுகளைச் சேகரிக்க பேச்சு தொழில்நுட்பத்தைப் பெரிதும் நம்பியுள்ளன.
நிகழ்வில் கலந்துகொண்ட மாணவர்கள் மற்றும் பேராசிரியர்கள்உரை ஒலி – Text to speech
கோப்புகளைத் தமிழில் படித்துக்காட்டும் இணையவழி மென்பொருள்கள் இன்று அதிகமாக உருவாக்கி வெளியிடப்பட்டுப் பயன்பாடுத்தப்படுகின்றன. அவைமுறையே
https://inforobo.com/text-to-speech-online
https://www.googletexttospeech.com/p/tamil-text-to-speech-online-mp3.html
என்றும் திறந்த மூல மென்பொருளாகவும் கிடைக்கின்றன. அவை முறையே
https://www.indiadict.com/web/text-to-speech.html
Text To Speech Free
TTSFree.com
https://ttsfree.com/ இவைகளும் கிடைக்கின்றன.
Top Open Source Speech Recognition Systems என்ற அடிப்படையில் முதல் பத்து இடங்களை பெற்றவையாக
1. Project DeepSpeech (This project is made by Mozilla, the organization behind the Firefox browser.)
2. Kaldi (Apache public license.)
3. Julius (1991 at the University of Kyoto, )
4. Wav2Letter++ (Facebook’s AI Research Team just 2 months ago.)
5. DeepSpeech2 (Chinese giant Baidu are also working on their own speech-to-text engine,)
6. OpenSeq2Seq (Developed by NVIDIA for sequence-to-sequence models training.)
7. Fairseq (Developed by Facebook and written in Python and the PyTorch framework.)
8. Vosk
9. Athena (TensorFlow.)
10. ESPnet -
Simon James என்ற ஆய்வாளர் தனது ஆய்வுக்கட்டுரையில் குறிப்பிட்டுள்ளார்
தமிழில் பேசுவதை எழுதும் பேச்சுத் தொழில்நுட்பத்தையும் உருவாக்கி வெளிவந்துள்ளது. அவை முறையே
- https://dictation.io/speech
- https://www.speechtexter.com/
- https://speechtyping.com/voice-typing/speech-to-text-tamil
இவ்வாறக தமிழில் பேச்சுத்தொழில் நுட்பம் பல கட்டங்களாக இன்று வளர்ந்து வந்திருப்பது தொழில்நுட்பத்தில் தமிழ்மொழியின் வளர்ச்சியைக் காட்டுகிறது என்று தனது உரையில் குறிப்பிட்டுப் பேசியுள்ளார்.
0 comments:
Post a Comment