පරිගණක වක්ත්ර සජීවනය
පරිගණක වක්ත්ර සජීවනය යනු ප්රාථමික වශයෙන් පරිගණක චිත්රක හා බැඳි එක් ක්ෂේත්රයක් වන අතර එහි අඩංගු වන්නේ මානව හිසෙහි සහ මුහුණෙහි අනුරූ නිමැවීමෙහි හා සජීවනයෙහි ආකෘති සහ ශිල්පක්රම වෙති. එහි විෂය ක්ෂේත්රය හා ප්රතිදාන ආකාරය හේතුවෙන් එය, මනෝවිද්යාවෙහි සිට සාම්ප්රදායික සජීවනය දක්වා පරාසය තුල පවතින වෙනත් බොහෝ විද්යාත්මක සහ කලාත්මක ක්ෂේත්රයන්ට ආශ්රිතව පවතියි. වාචික සහ අවාචික සන්නිවේදනයෙහිදී මිනිස් මුහුණෙහි වැදගත් බව නිසාවෙන් හා පරිගණක චිත්රක දෘඪාංගයන්හී සහ මෘදුකාංගයන්හී අභිවර්ධනයන් නිසාවෙන් පරිගණක වක්ත්ර සජීවනය කෙරෙහි සැලකිය යුතු තරම් විද්යාත්මක, තාක්ෂණික හා කලාත්මක සැලකිල්ලක් යොමුවී ඇත.
වක්ත්ර සජීවනය සඳහා පරිගණක චිත්රක ක්රම ප්රවර්ධනය කිරීම 1970 ගණන්වල මුල් භාගයෙහි ඇරඹුනද, මෙම ක්ෂේත්රයෙහි ප්රධාන සාධනයන් මෑතදී සිදුවී ඇති අතර 1980 ගණන් වල අග භාගයෙන් පසුව සිදුවී ඇත.
රූපජනනයෙහි සිට ත්රිමාන ආකෘතිකරණය සහ විදැහුම දක්වා දිගු පරාසයක විවිධ ශිල්පක්රම මාලාවක් පරිගණක වක්ත්ර සජීවනයට අයත් වෙයි. සජීවනකෘත වෘත්තාන්ත චිත්රපට හා පරිගණක ක්රීඩා විෂයයෙහි එහි භාවිතය චීරප්රකට හා ජනප්රිය වුවද සන්නිවේදනය, අධ්යාපනය, විද්යාත්මක විලම්බනය, සහ කාරක-පාදක පද්ධතීන් (නිදසුනක් ලෙසින් සබැඳි පාරිභෝගික සේවා නියෝජකයන්) වැනි තවත් බොහෝ ක්ෂේත්රයන්හී එහි යෙදුම් පැතිර පවතියි.
ඉතිහාසය
සංස්කරණයඅවුරුදු සිය ගණනක සිටම විද්යාත්මක අන්වේශණයට ලක් වු විෂයක් ලෙස මනුෂ්ය වස්ත්ර අභිනය හැදින්විය හැක. චක්ත්ර සංචලනය සහ අබිනය පිළිබද අධ්යනයක් ඇරඹුවේ ජෛව විද්යාත්මක දෘෂ්ටි කෝණයකිනි. 1640 දී පමණ සිදු කෙරැණු John Bulwer ගේ අධ්යනයන්ට පසුව චාල්ස් ඩාවින්ගේ කෘතියක් වන The Expressions of the Emotions in Men and Animals යන කෘතිය චර්යාත්මක ජීව විද්යාවේ නුතන පර්යේෂණ වලට මහත් ඉවහලක් විය.
මෑතක දී වක්ක්ර සංචලනයන් විස්තර කිරිමට ගන්නා ලද වැදගත් උත්සහයක් ලෙස Facial Action Coding System (FACS) හැදින්විය හැක. Ekman සහ Friesen විසින් 1978 දදී හදුන්වාදෙනු ලැබු FACS මුලික වක්ත්ර ක්රියා ඒකක 64 නිර්වචනය කරයි. මෙම ක්රියා ඒකක අතුරින් ප්රධාන කොටසක නිරැපණය කරන්නේ ඇස් බැමි ඉහල දැම්ම, ඇස් ගැසීමේ දී, කතා කිරිමේ දී වක්ත්ර පේශින්ගේ මුලික සංචලනයන්ය. ක්රියා ඒකකයන්ගේ 8 ක් වෙන් වී ඇත්තේ දැඩි, ත්රිමාන, හිසෙහි සංචලනයන්ටය. එනම් දකුණට සහ වමට හිස කැරකවිම සහ ඇඹරවීම හා උඩ පහළ, ඉදිරියට සහ පසුපසට චලනය කිරිම, කෘතිම මුහුණු වල සංචලනයන් විස්තර කිරිමට සහ වක්ත්ර ක්රියාන් ගැන විමසිලිමත් වීමට FACS සාර්ථකව යොදා ඇත.
පර්ඝනක මුල වක්ත්ර අභිනය ආදර්ශනය සහ සජීවනයට නුපුරැදු වෑයමක් නොවේ. 1970 ගණන් වල මුල සිටම පාහේ පරිගණක මුල වක්ත්ර අභිනය නිරෑපණය සිදු විය. ප්රථම ත්රිමාන වක්ත්ර සජීවනය නිර්මාණය කරනු ලැබුවේ 1972 දී Parke විසිනි. 1973 දී Gillenson විසින් ඉරි මගින් අදින ලද වක්ත්ර අනුරෑ එක්ලස් කොට සංස්කරණය කිරිමේ පද්ධතියක් සොයා ගන්නා ලදි. 1974 දී Parke විසින් පරාචිතිකකරණය වු ත්රිමාන වක්ත්ර අකෘතියක් වැඩි දියුණු කරන ලදි.
1980 වසරේ මුල් භාගය වන විට Platt විසින් ප්රථම වරට ශරිරික මුල, පේශි මගින් පාලනය කල හැකි වක්ත්ර ආකෘතිය දියුණු කිරිම සහ Brennan විසින් විකට වක්ත්ර නිරෑපණය සදහා ක්රම විධි දියුණු විම ආදිය සිදු විය. වක්ත්ර සහජීවනයේ සන්ධිස්ථානයක් ලෙසන 1985 දී නිර්මාණය වු Tony de Peltrie චිත්රපටය හැදින්විය හැක. මෙහිදි ප්රථම වරට කථාවස්තුව දිග හැරීමේද පරිගණක වක්ත්ර අභිනය සහ කථන සජීවනය වැදගත් අංගයක් ලෙස සලකා තිබිණි.
1980 හි අගභාගය වන විට මාංශ පේශි මුලික ආකෘතියක් වැඩි දියුණු කිරිමටWaters ට හැකි විය. තවද මෙම කාලය තුල දීම Maegnenat Thalmannසහ සෙහයකයින් විසින් විසංයුක්ත පේශි ක්රියා ආකෘතියක් වැඩි දියුණු කිරිම සහ ස්වයං පාලිත කථන සමමුහුර්ථකරණයකරා Lewis සහ Hill ළගා වීම යන සිදුවීම් ද ඇති විය. Toy story, Antz shrek, සහ Monsters. Inc ආදි සිජීවනය චිත්රපටය සහ Sims වැනි පරිගණක ක්රිඩා වලදී නිරෑපිත අයුරින් කථාව දිග හැරිමේ ප්රධානතම සංචරචකයක් ලෙස වක්ත්ර සජීවන ක්රමවේද වැඩි දියුණු විම මෙන්ම පරිගණක වක්ත්ර සජීවනය භාවිය සම්බන්ධ ක්රියාකාරකම් 1990 දශකයේදී බොහෝ සෙයින් දක්නට ලැබිණි. 1995 දී තිරගත වු මෙම කාල සීමාව තුල වැදගත් සන්ධිස්ථානයක් ලෙස හැදින්විය හැක. මෙයට හේතුව වන්නේ මෙහි ප්රධාන චරිතය විශේෂුයෙන්ම ඩිජිටල් වක්ත්ර සජීවනය උපයෝගී කර ගනිමිනි නිපද වු ප්රථම චිත්රපටය වීමය. (Toy story චිත්රපටය තිරගත වුනේ ද එම වසරේ අග භාගයේදී ය)
චිත්රපට වල විදග්ධතාව ක්රමයෙන් වර්ධනය වුයේ 2000 වසරින් පසුවය.The matrix Reloaded and Matrix Revolutions යන චිත්රපටයන්හි මුහුණෙහි සැම ස්ථානයකම වක්ත්ර සංචලනය තාත්වික ලෙස ග්රහණය කර ගැනීම සදහා අධි තාක්ෂණික කැමරා කිහිපයක් මගින් ඝනත්වයෙන් ඉහල ප්රකාශ ප්රවාහයක් යොදා ගැනිනි. Polar Express චිත්රපටයෙහි එවැනි ලකුණු 150 ක් පමණ ග්රහණය කර ගැනීම සදහා විශාල Vicon පද්ධතියක් යොද ගෙන ඇත. මෙම පද්ධතින් ස්වයංක්රිය වුව ද දත්ත පරිහරණය කල හැකි මට්ටමක ගෙන ඒමට විශාල හස්තිය වැයමක් දැරිය යුත= වේ. වක්ත්ර සජීවිකරණයේ තවත් සන්ධිස්ථානයක් ලෙස Lord of the Rings දැක්විය හැක. මෙහිදි චරිතයට විශේෂිත වු හැඩතල මුලික කර ගත් පද්ධතියක් වැඩි දියුණු කොට ගෙන තිබිණි. Mark පුරෝගාමිත්වයෙන් විනෝදාත්මක වක්ත්ර සජීවනයේ FACS භාවිතය ඇරඹුනු අතර FACS මුලික පද්ධතින් යොදා ගෙන Monster House, Kinkong වැනි චිත්රපට නිශ්පාදනය විය.
ශිල්පක්රම
සංස්කරණයද්වීමාන සජීවනය
සංස්කරණයනිශ්චල ඡායාරූපකරණයෙහි හා සදෘශ්ය පටිපාටින්හී රූපයන් ඇතුළු රූප මත රූපාන්තරණය සිදු කෙරුම ද්වීමාන වක්ත්ර සජීවනය සාමාන්යයෙන් පාදක කර ගනියි. රූප මත රූපජනනය කෙරුම වනාහී නිශ්චල රූප යුගලයක් අතරතුර හෝ සදෘශ්ය පටිපාටීන් වෙතින් වූ රූප රාමු අතරතුර හෝ අතරමැදි සංක්රාන්තිමය රූපයන් නිමැවීම සඳහා අවකාශ සලසන ශිල්පක්රමයකි. මෙම රූපජනන ශිල්පක්රම සාමාන්යයෙන් සමන්විත වන්නේ ඉලක්ක රූප පෙලගස්වන්නාවූ ජ්යාමිතික විරූපණ ශිල්පක්රම සංයුක්තයකින් සහ, රූප වයනයෙහි සුමුදු සංක්රාන්තිය නිමවන අතුරු-මලැයීමකිනි. මයිකල් ජැක්සන්ගේ "බ්ලැක් ඕ වයිට්" නමැති සදෘශ්යය තුල රූප විෂයයෙහි රූපජනනය කිරීම පිළිබඳ මුල් නිදසුනක් හමුවෙයි. ජීවවිද්යාත්මක සහ පරිගණනමය අධ්යයනය පිළිබඳ එම්අයිටී කේන්ද්රයෙහි සේවය කල එසාට් සහ පොගියෝ විසින් 1997 දී මයික්ටෝක් නම් පද්ධතියක් නිර්මාණය කල අතර එය විසින් රූපාණු නිරූපණය කරමින් රූප වල ප්රධාන රාමු අතර රූපජනනය සිදුකරන්නේ කථන සජීවනය තැනීමටයි.
රූප මගින් සජීවනය සිදු කිරීමෙහි තවත් අයුරක් සමන්විත වන්නේ සදෘශ්යයකින් අත්පත් කරගත් පටිපාටි එකිනෙක සංදාමායනය කිරීමෙනි.
ත්රිමාන සජීවනය
සංස්කරණයපරිගණකගත මුහුණු සජිවීකරණයේ ප්රධානතම ක්රමවේදයක් ලෙස ත්රිමාණ හිස් ආකෘති දැක්විය හැක. මුල් කාලීනව සජිවිකරණ ය සඳහා පරිගණකගත හිස් ආකෘති කරන ලද්දේ පාකේ (parke) විසිනි. මෙම ආකෘතිය පාලනය වුයේ හදුනාගත් ප්රකාශක හා අනුගතයන් සමූහකිනි. ප්රධාන ලක්ෂණ වන ඇස්,තොල්, පෙර සඳහන් කළ කණ්ඩායම විසින් පාලනය කරනු ලබයි. මෙම අංග ලක්ෂණ (facial actions) වෙනස් කිරීම තුළින් හිස් ආකෘතියට නව පෙනුමක් ලබා දිය හැක. පසුව සඳහන් කළ අංග ලක්ෂණ මඟින් තොල් විහිදුවීම හෝ ඇස් වැසීම වැනි ක්රියාකාරකම් කල හැක. පසුව අනෙක් පර්යේෂකයන් විසින් වැඩි අංග ලක්ෂණ හා නම්යශීලීතාවක් ලබා දෙන ලදී. සාමාන්ය ආකෘති ඇරඹීමේ විවිධ ක්රම හඳුන්වාදී ඇති අතරම ඒවා සාර්ථක ලෙස නිෂ්පාදනය කර ඇත. ජ්යාමිතික ආකෘති ක්රම භාවිතා කිරීම සාර්ථක ක්රමයක් වන්නේ එහි දී සීමිත පරිමාණ කිහිපයක් අංක ලක්ෂණ මුහුණු යෙදීම සඳහා භාවිතා කිරීම නිසාය. MPEG 4 සම්මතයට අනුව අවම පරිමාන සංඛ්යාවක් නියම කරයි.
සජිවීකරණය කරනු ලබනනේ කාලානුරූපව පරිමාන වෙනස් කිරීම තුළිනි මුහුණත් සජිවීකරණයේ සම්ප්රදායික ක්රම පහත පරිදි වේ.
1. Shapes/morph targets
2. bones/cages
3. skeleton - muscle system
4. Motion capitul an points on the face
5. knowledge based solver deformations
1. Shape based systems මඟින් ක්ෂණික මාරු වීම මෙන්ම වැඩි හැගීම් ප්රකාශ කිරීමේ හැකියාවක් ද ඇත. මෙම ක්රමවේදය මුහුණේ කොටස් වල හැගීම් එක්කර එනම් තවත් කුඩා දැල් වලට සම්පූර්ණ මුහුණත දැල බෙදා වෙන්කිරීමක් සිදුකරයි. මෙලෙස ඉදිරිපත් කල සාර්ථක චරිතය ලෙස ලෝර්ඩ් ඔෆ් ද රින්ග් (Lord of the Rings) චිත්රපටයේ ගොලමි (Gollum) චරිතය හඳුන්වා දිය හැක. මෙම ක්රමයේ අවාසිය වන්නේ සාර්ථක නිර්මාණයක් කිරීමට අධික ශ්රම පිරිසක් යොදා ගැනීමට සිදුවීමයි.
2. Skeletal Muscle system මඟින් හිසේ හා මුහුණෙහි ආකෘති ඇඹීමට වෙනත් ක්රමවේදයක් භාවිතා කරයි. මෙහි දී ශරීර ස්ථාන හා අවයව ජීවමය ස්වරූපයක් ගැනීම සඳහා සම, ඇටසැකිලි නිරූපණය කිරීමක් සිදුකරයි. මෙම ක්රමවේදය භාවිතා කිරීම තුළින් ජීවමය පෙනුමක් ලබා ගත හැකි මුත් ඉතා සංකීර්ණ ක්රියාදාම සිදුකිරීම සිදුවන නිසා පරිගණකය වියදම අධික වන අතරම අසීරුතාවය වැඩි වීමක් ද සිදුවේ. Parametanied ක්රමය හා සසදන විට වැඩි පිරිසකගේ මතය වන්නේ මෙම ක්රමය වඩා කාර්යක්ෂම තේරීමක් නොවන බවයි. නමුත් මෙමඟින් ඇති වාසිදායක අංග වන වැඩි අංගලක්ෂණ පෙන්වීමට ඇති හැකියාව නිසා අවස්ථානුකූලව යොදාගත හැක. වෝටර්ස් (waters) ටෙස් පොලොයුස් (Terxopoulos) කේලාර් (Kehler)හා සිඩෙල් (Seidel) යන නිර්මාණකරුවන් මුහුණත සජිවිකරණ ක්රමවේද නිර්මාණය කර ඇත.
3. Envelope Bones හෝ Cage බොහෝ විට පරිගණක ක්රිඩා වල භාවිතා කර ඇත. එයට හේතුව ඒවා සරල මෙන්ම වේගවත් ආකෘති නිපදවීමට ඇති හැකියාවයි.
4. Mation capture ක්රමය වස්තුව වටා කැමාවන් යෙදීමක් සිදුකරයි. සාමාන්යයෙන් වස්තුව වටා දර්ශන තැටි හා චල යන්ත්ර සවිකර අවකාශයෙන් අදාල වස්තුවට අයිති ප්රමාණය ඉහතා නිවැරදි ලෙස ගණනය කරනු ලබයි. පසුව කැමරාවන් වලින් හසුකරගන්නා ත්රිමාණ පරිගණක වැඩසටහනට පරිවර්තනය කිරීමක් සිදු කරයි. මෑතක් වන තුරු දත්ත ලබා ගන්නා යන්ත්ර වල ඇති විශාල බව නිසා Motion capture තාක්ෂණය මුහුණත සජිවීකරණයට නුසුදුසු විය. නමුත් පසුකාලයේ දී උපාංග කුඩා වන විටක් සමඟ මෙම ක්රමය මුහුණත සජිවිකරණයට යෙදීම පහසු විය. facial motion capture ක්රමය පෝලර් එක්ස්ප්රස් (polar Expresc) චිත්රපටියේ දී යොදාගන්නා ලදී. මෙම චිත්රපටියට සාර්ථක වූ නමුත් විචාරකයන් පවසන ලද්දේ මෙහි චරිත වලට ජීවමාන ස්වාභාවයක් ලබා දීමට නොහැකි වී ඇති බවයි. එනම් මිනිස් ඇසට පෙනෙන මානයේ ජීවමය ස්වරූපයක් තිබුණත් හැගීම් ප්රකාශ කිරීමට අපොහොසත් වී ඇති බවයි. Motion capture ක්රමයේ දී ඇති වන අසීරු බව වන්නේ ලබා ගන්නා දත්ත එතරම් උසස් තත්වයේ නොතිබීමයි.
5. Deformation Solver ක්රියාදාමයට උදාහරණයක් ලෙස හැඳින්විය හැක. face robot
කථන සජීවනය
සංස්කරණයවාචික පණගැන්වීමත්, වක්ත්ර අභිනයයන් පණගැන්වීමත් එකිනෙකට වෙනස්ය. මක් නිසාද යත් සජීවිකරණට එළැඹීමට ඇති සරල ප්රධාන රාමුවන්, සැබෑ වාචික ගති විද්යාවන් වලට දුර්වල පිවිසුම් සපයන බැවිනි. කමනයන් ලබා ගැනිමේ ප්රධාන මාර්ගය ලෙස Visemes යොදා ගනී. (නියමිත ශබ්ද කොටසක් නිර්මාණය කිරිමේ දී තොල්, හක්ක සහ දිව පිහිටන ස්ථානය) කෙසේ වෙතත් ස්වාභාවික ශබ්දයන් නිර්මාණය කිරීමේ දී, වටිනා වෙනස් ප්රභේදයක් කිහිපයක් Visemes තුළ ඇත. මෙම වෙනස් ප්රභේදයන් වල මූලය Coarticulation ලෙස හඳුන්වන අතර එය Visemes වල පිහිටා ඇති ආකාරය නිසා ඇතිවූ බලපෑමකි.
Coarticulation වලට ගණන් තැබීමේ දී දැනට පවතින පද්ධතීන්, Visemes හි ප්රධාන රාමුන් යොදා ඇති ආකාරය හෝ වචන, වැනි යොදා ඇති ආකාරය මෙන්ම diphone, triphone, syllable වැනි පද්ධතීන් යොදාගෙන ඇති ආකාරයද සැලකිල්ලට ගනී.
chen සහ Massaro විසින් හදුන්වා දෙන ලද ප්රමුඛ මෙවලම් භාවිතය මඟින් වාචික සජිවිකරණයට මූලික අඩිතාලමක් විය. වාචික උච්චාරණය කෙරෙහි viseme හි බලපෑම මෙම සෑම මෙවලමක් මඟින්ම පාලනය කරයි. viseme හි මධ්යයේ දී මෙම බලපෑම විශාල විය හැකි අතර එමඟින් viseme මධ්යය තෙක් ඇති දුර අඩු කරයි. වාචික පරාවක්ර ගොඩනැගීමට රේඛා එකතු වී ඇති ආකාරය එයට උදාහරණයක් ලෙස පෙන්වා දිය හැකිය. මෙම සෑම මෙවලමකම හැඩය එමඟින් පාලනය කරන්නා වූ මුහුණේ ආකාරය මතත්, එහි ඇති viseme මතත් රඳා පවති. මෙම පරිගණකයෙන් සිදුකරන්නා වූ වාචික සජිවිකරණය Baldi නමැති කතා කරන හිස තුළ දක්නට ඇත.
අනෙකුත් වාචික මොඩියුල viseme වෙනුවට පද සම්බන්ධයක් ඇති මූලික ඒකක යොදාගනි. සබඳතාවය අනුව සෑම viseme හිම වෙනස්වීමෙ මූලික ඒකකයන්හි අන්තර්ගත කර ඇති අතර viseme හි සමහර ඒකකයන් සඳහා Coarticulation මොඩියුල අවශ්ය නොවේ. දත්ත පද්ධතියන් මඟින් සුදුසු ඒකකයක් තෝරා ගෙන කතනය ගොඩනඟා ඇති අතර මෙය වාචික සංකලනයට අනුබද්ධ නොයෙකුත් තාක්ෂණික ක්රමශිල්ප වලට සමානවේ. මෙම ඒකකයන්හි ඇති අවාසියක් නම් ස්වාභාවික ප්රතිඵලයන් ලබාදීම සඳහා එකතු කරගත් දත්ත විශාල ලෙස අවශ්ය වීමයි. මෙයට අවශ්ය දත්ත ගබඩාවේ ප්රමාණය එම ඒකකයන්හි ප්රමාණයන් මත රඳා පවතී.
අවසාන වශයෙන් සමහර ඒකකයන් විසින් වාචික සජිවීකරණය සෘජු ලෙසම ශබ්ද මඟින් නිෂ්පාදනය කරයි. මෙම පද්ධතින් බොහෝ විට hidden marker මොඩියුල හෝ ස්නායු ජාලයන් ශබ්ද පරාමිතීන් වක්ත්රීය මොඩියුල බවට පරිවර්තනය කිරිමට යොදා ගනි. මෙම ක්රමයේ ඇති වාසින් නම් සංකීර්ණ ඇල්ගෝරිතම භාවිතයෙන් තොරව ශබ්ද පාලනයට ඇති හැකියාවත්, රිද්මය, තාල වේගය පාලනය කිරිමට ඇති හැකියාවත්ය. phoneme හෝ viseme අවශ්ය නොවන නිසා මෙයට දත්ත ගබඩාවක් ද අවශ්යවන්නේ නැත. මෙයට අවශ්ය එකම දත්තය වන්නේ ශබ්ද හා සජීවිකරණ පරාමිතීන්ය. මෙයට නිදසුනක් ලෙස Johnie කථන පද්ධතිය පෙන්වා දිය හැකිය.