وقتی بازتاب چشم ها مکان را لو می دهند!
به گزارش وبلاگ اخبار جدید، تبدیل انعکاس تصاویر در چشم به صحنه های سه بعدی طرح جاه طلبانه ای است که مسیری طولانی را در پیش رو دارد، ولی گام های ابتدایی مهمی دراین مسیر برداشته شده است.
به گزارش خبرآنلاین، محققان دانشگاه مریلند پیروز شده اند تا انعکاس چشمی را به صحنه های سه بعدی که تا حدودی قابل تشخیص هستند، تبدیل نمایند. این کوشش ها برپایه میدان های تابشی عصبی (NeRF)، یک تکنولوژی هوش مصنوعی که محیط ها را از تصاویر دوبعدی بازسازی می نماید انجام می گردد.
اگرچه رویکرد انعکاس چشم راه درازی را پیش رو دارد تا بتواند کاربردی عملی داشته باشد، اما این تحقیقات دیدگاهی اجمالی و جالب توجهی از فناوری ارائه می دهد که می تواند در آینده محیطی را از مجموعه ای از عکس های پرتره ساده به نمایش بگذارد.
روند کار به چه ترتیب است؟
اعضای تیم تحقیقاتی با استفاده از تصاویر متوالی ثبت شده به وسیله یک سنسور و با بهره گیری از انعکاس های ظریف نور گرفته شده از چشم انسان، برای تشخیص محیط اطراف فرد اقدام کردند. آن ها کار را با چندین تصویر با وضوح بالا که ثبت آن ها به وسیله یک دوربین که در جایی ثابت شده بود، شروع کردند و فردی متحرک را به تصویر کشیدند که به دوربین نگاه می کرد. آن ها سپس روی بازتاب ها و واکنش ها زوم کردند؛ آن ها را جدا نموده و به محاسبه این پرداختند که چشم های فرد در عکس ها به چه نگاه می نمایند.
نتایج این آزمایش، یک بازسازی محیطی قابل تشخیص از چشم انسان را در یک محیط کنترل شده نشان داد. این صحنه با استفاده از یک چشم مصنوعی (عکس زیر) ثبت شده و صحنه ای رویایی و چشمگیر را خلق کرد. البته کوشش برای مدل سازی انعکاس های چشم در هنگام تماشای موزیک ویدیو های مایلی سایرس و لیدی گاگا، حباب های مبهمی را فراوری کرد که محققان تنها توانستند حدس بزنند که این ها در واقع دریچه های LED و دوربینی روی سه پایه هستند؛ این نشان می دهد که این فناوری تا حد زیادی با کاربردی شدن در دنیای واقعی فاصله دارد.
اعضای تیم برای بازسازی صحنه های خام و مبهم هم بر موانع مهم و بزرگی غلبه کردند. به عنوان مثال، قرنیه نویز ذاتی ای را معرفی می نماید که تفکیک آن از نوربازتاب یافته از بافت پیچیده عنبیه انسان سخت و پیچیده است. برای رسیدگی به این موضوع، بهینه سازی حالت قرنیه (تخمین موقعیت و جهت قرنیه) و تجزیه بافت عنبیه (استخراج ویژگی های منحصر به فرد قرنیه فرد) در طول آزمایش ها انجام شد. در نهایت از دست دادن منظم سازی بافت شعاعی (تکنیک یادگیری ماشینی که بافت های صاف تری را نسبت به ماده منبع شبیه سازی می نماید)، به جدا سازی و بهبود بهتر مناظربازتاب یافته یاری کرد.
مسیری طولانی پیش روست
به رغم پیشرفت های چشمگیر و ارائه راه چاره های هوشمندانه، همچنان موانع قابل توجهی نیز پیش روست. در بخشی از مقاله منتشره در این باره می خوانیم: نتیجه فعلی دنیای واقعی، از یک تنظیم آزمایشگاهی مثل تصویربرداری با بزرگ نمایی از صورت یک فرد، نور های منطقه ای برای روشن کردن صحنه و حرکت عمدی فرد حاصل می گردد. ما بر این باور هستیم که بعضی تنظیمات بدون محدودیت، همچنان چالش برانگیز خواهند بود؛ از جمله ویدیو کنفرانس با حرکات طبیعی سر ... و علت آن هم وضوح پائین تر سنسورها، محدوده دینامیکی و تاری حرکت است.
به علاوه، اعضای تیم به این نکته اشاره کردند که فرضیه جهانی درباره بافت عنبیه ممکن است خیلی ساده تر از چیزی باشد که به طور گسترده اعمال گردد؛ مخصوصا زمانی که چشم ها معمولا بیشتر از این تنظیمات کنترل شده، می چرخند و حرکت می نمایند.
درهر حال، اعضای تیم تحقیقاتی پیشرفت خود را به عنوان نقطه عطفی می دانند که به پیشرفت های آینده یاری زیادی خواهد نمود: با این کوشش ها، ما امیدواریم تا بتوانیم الهام بخش کاوش های آینده باشیم که از سیگنال های بصری غیرمنتظره و تصادفی برای ارائه اطلاعات درباره دنیای اطرافمان استفاده می نماید و افق بازسازی صحنه های سه بعدی را توسعه می دهد.
با وجودی که نسخه های کامل تر این تحقیق می تواند باعث نفوذ وحشتناک و ناخواسته به حریم خصوصی افراد گردد، اما حداقل می توان با خیال راحت گفت که نسخه امروزی تنها می تواند در ایده آل ترین شرایط یک عروسک را به شکلی مبهم تشخیص دهد.
منبع: engadget
منبع: فرارو