گوگل درحال ارتقای سیستم تشخیص دستخط در اپلیکیشن صفحهکلید جیبورد است. جیبورد هماکنون برای دو سیستمعامل موبایلی آیاواس و اندروید ارائه شده و بیش از ۵۰۰ زبان دنیا را پشتیبانی میکند. حالا نسخهی جدید این کیبورد با بهره بردن از هوش مصنوعی سریعتر نسبت به قبل بین ۲۰ تا ۴۰ درصد خطای کمتری در تشخیص دستخط کاربر دارد. در نسخههای قبلی این صفحهکلید از مدلهای یادگیری ماشینی برای تشخیص دستخطاستفاده شده بود. این جزئیات توسط محققانی که در بخش هوش مصنوعی گوگل کار میکنند، در قالب یک پست در بلاگ این شرکت شرح شده است.
ساندرو فوز و پِدرو گونتی از مهندسان ارشد نرمافزاری گوگل میگویند:
فرآیندهای موجود در یادگیری ماشینی باعث شده تا مدلهای معماری و روشهای آموزشی جدیدی در دسترس قرار گیرد و این مورد به ما امکان میدهد تا بهجای استفاده از یک مدل که بهعنوان ورودی کلی عمل میکند، در راهکارهای اولیهمان تجدیدنظر کنیم.
در ابتدای سال جاری، ما مدلهای جدید را برای همهی زبانهای مبتنی بر لاتین در اپلیکیشن جیبورد معرفی کردیم.
مقالات مرتبط:
همانطور که فوز و گونتی توضیح دادهاند، اکثر سرویسهای تشخیص دستخط از نقاط لمسی برای شناسایی و انجام عملیات روی کاراکترهای دستنویسشده استفاده میکنند. جیبورد ابتدا مختصات نقاط لمسشده را به حالت عادی درآورده تا اطمینان حاصل کند که این نقاط با نرخ نمونهسازی lojgt و دقت لازم روی دستگاه باقی میماند و سپس آنها را به یک توالی از منحیهای مکعبی Bézier تبدیل میکند. Bézier منحنیهای پارامتریکی هستند که استفاده از آنها در گرافیک رایانهای رایج است. بهگفتهی فوز و گونتی، مزیت اصلی توالیهای مذکور، کوچکتر بودن آنها از توالی پایهایِ نقاط ورودی است. درنهایت هر منحنی با یک (بیان متغیرها و ضرایب) تعریف چندجملهای توسط نقاط شروع، نقاط پایان و نقاط کنترل نمایش داده میشود. بهعنوان مثال کلمهی «GO» شاید شامل ۱۸۶ نقطه باشد که با استفاده از توالی چهار منحنی (و دو نقطه کنترل) Bézier برای حرف "G" و نیز سه توالی منحنی برای حرف «O» نمایش داده میشود.
این توالیها بهعنوان ورودی به یک شبکه عصبی ارسال میشوند تا روش شناساسی کاراکترهای دستنویس را بیاموزد و بهطور دقیقتر یک نسخهی دوطرفه از شبکههای عصبی شبه تجربی (QRNN) و یک شبکه با قابلیت موازیسازی بهینه و بنابراین عملکرد خوب در پیشبینی، بهدست خواهد آمد. مهمتر اینکه QRNN تعداد وزنها (دوام ارتباطات بین توابع ریاضی یا گرهها) را نگه میدارد و همین مورد باعث میشود تا شبکه بهطور نسبی کوچکتر و حجم فایل کاهش یابد.
اما مدل هوش مصنوعی چگونه میتواند منحنیها را درک کند؟ با ایجاد یک ماتریکس از ستونها و سطرها در جایی که هر ستون با یک منحنی ورودی مطابقت دارد و هر سطر نیز با یکی از حروف الفبا منطبق است. این خروجی شبکه با مدل زبان مبتنی بر کاراکتر ترکیب شده و دو نتیجه در پی خواهد داشت؛ نتیجه مثبت اینکه توالی مناسب کاراکترهای رایج در یک زبان ایجاد میشوند و نتیجه منفی اینکه یکسری توالیهای غیررایج نیز ایجاد خواهد شد. توالیهای بهدستآمده از نقاط لمسی هم بهطور جداگانه به یک ترکیب کوتاهترِ مرتبط و نهایتا به یک منحنی تبدیل میشود. در پایان تشخیصدهندهی مبتنی بر QRNN با دریافت توالی منحیها، یکسری توالی از احتمالات کاراکترها بهعنوان خروجی ارائه میکند.
مقالات مرتبط:
سیستم جدید تشخیص دستخط کیبورد جیبورد گوگل یک شاهکار است که با تبدیل مدلهای شناسایی (که در فرمورک یادگیری ماشینی TensorFlow گوگل آموزش دیده) به مدلهای سبک TensorFlow بهدست آمده است. استفاده از نسخهی لایت بهجای نسخهی کامل TensorFlow به تیم توسعهدهنده سیستم مذکور اجازه میدهد تا عملیات مورد نظر را در زمان کمتری اجرا کرده و علاوهبراین میزان استفاده از حافظه را توسط جیبورد کاهش دهند. فوز و گونتی در بخش دیگری از پست بلاگی خود میگویند:
ما در تلاش هستیم تا شناسایی زبانهای مبتنی بر لاتین را همواره بهبود دهیم. تیم تشخیص دستخط قبلا برای اضافه کردن مدلهای تشخیص دستخط در همهی زبانهایی که در کیبورد جیبورد پشتیبانی میکنیم، راه سختی را پیموده است.
برای تبدیل دنیای واقعی به یک چکیدهی دیجیتالی، دانستن فرایند خلاصهنویسی ضروری است و توسعهدهندگان هم مانند مترجمان ادبی باید این فرایند را یاد بگیرند. اما منظور از عمل ترجمه چیست؟ اومبرتو اکو (فیلسوف و نشانهشناسی از قرن بیستم) ترجمه را بهصورت خلاصه این چنین تعریف میکند: بیان نکتهای به زبانی دیگر.
تشبیه، ابزار قدرتمندی برای حل مسائل جدید و یافتن راهحلهای خلاقانه برای آنها است؛ بنابراین از تشبیهبرنامهنویسی به ترجمه چه میتوان آموخت؟ برای مثال، برنامهنویسی، مسائل دامنهای (مثل موجودی انبار سختافزار، یک کاتالوگ کتابخانهی عمومی، سیستم رزرو بلیت) را به برنامههای کامپیوتری ترجمه میکند.
تطبیق سیستم دنیای واقعی با دنیای دیجیتالی به معیارهای متعددی وابسته است. برای تبدیل دادههای آنالوگ به دادههای دیجیتال، فرایند گسستهسازی یا تجزیه لازم است؛ اما تجزیه و گسستهسازی مفاهیم به انحراف در معنا وابسته هستند؛ اما این سؤال مطرح میشود که مترجمهای معمولی چگونه مشکل انحراف یا دوگانگی معنایی را حل میکنند؟ برنامهنویسها چه درسهایی میتوانند از آن بگیرند؟
کتاب، جلد، دستورالعمل، جنسیت
با مثال کتابخانهی دادهها و واقعیت از ویلیام کنت، میتوان به سؤالهای فوق پاسخ داد. در ابتدا لازم است مفاهیم اصلی دامنهی موردنیاز مشخص و سپس به زبان طبیعی ترجمه شوند. سپس، یک مجموعهی واژگان از دامنهی موردنظر ساخته شود. در این نمونه مجموعهی واژگان شامل کتابها، مؤلفها، ناشرها، ژانرها و موارد دیگر است.
با مجموعهی واژگان میتوان مفاهیم را به یک زبان برنامهنویسی برگرداند و چکیدههایی قابلدرک را برای کامپیوتر ساخت؛ اما چگونه میتوان فهمید، کدام یک از مفاهیم واقعی باید به خلاصههای برنامهنویسی تبدیل شوند؟
در ساخت نرمافزار کتابخانهای میتوان فرض کرد یک کتاب برابر با یک انتزاع یا شیء داخل برنامه باشد؛ اما یک کتاب از چه مواردی تشکیل شده است؟ اگر مؤلفی مثل جودی واکمن جامعهشناس، دو کتاب منتشر کرده باشد، پایگاه دادهی کتابشناسی، دو شاخص از یک کتاب را در محتوای خود خواهد داشت (برای مثال TechnoFeminism و Feminism Confronts Technology).
در مورد ساخت پایگاه داده برای قرض کتاب چه میتوان گفت؟ اگر یک کتابخانه پنج کپی از دو کتاب را بخرد، بهمعنی وجود ده رکورد کتاب در پایگاه داده است. معنای کتاب، براساس زمینه هم تغییر میکند: در پایگاه دادهی کتابشناسی، بر عناوین مجزا تفکیک میشوند؛ درحالیکه پایگاه دادهی قرض کتاب به تعداد کل کپیهای کتابخانه اشاره دارد.
مقالههای مرتبط:
مجموعهی چهارجلدی هنر برنامهنویسی کامپیوتری اثر دونالد نوت را چگونه میتوان در یک کتابخانه توصیف کرد؟ این مجموعه را باید یک کتاب به شمار آورد یا چهار کتاب مجزا؟ در مورد نسخهی سهگانهی ارباب حلقهها چه میتوان گفت که سه کتاب در یک کتاب قرار دارد؟ (طبق درخواست تالکین). مسئلهای که در ابتدا ساده به نظر میرسید (کتاب، یک کتاب است) حالا پیچیده و پر از جزئیات شده است.
طبقهبندی، کار سادهای نیست. در نمونهی کتابها یک طبقهبندی نادرست، جستجوی عنوان و دسترسی به اطلاعات کتاب را محدود میکند. سیستمهای طبقهبندی بدون انعطاف و دارای انحراف میتوانند تأثیرگذاری مؤلف را کاهش دهند. برای مثال در بعضی کشورها، نام خانوادگی زنان پس از ازدواج، به نام خانوادگی همسر آنها تغییر میکند.
یکی از پیشتازان علم کامپیوتر، کاتلین بوت نی بریتن در سال ۱۹۴۷ مقالهای با عنوان معرفی اولین زبان اسمبلی: بریتن نوشت اما با نام خانوادگی همسر خود، بوت، کتاب را منتشر کرد. اگر پایگاهدادهای آثار منتشرشده را براساس نام تولد و نام تأهل او به هم لینک نکند، آن وقت ممکن است شخص در جستجوی مقالههای شخص اشتباه کند و به این صورت تأثیرگذاری او دستکم گرفته شود. همین اتفاق هنگام جستجوی مقالههای باربارا لیسکف (نی هوبرمن) هم رخ میدهد.
وقتی شخصیت به میان میآیند، تعریف انتزاع برنامهنویسی دشوارتر میشود. حالا فرض کنید دراینمیان بحث جنسیت هم مطرح شود، چه اتفاقی رخ میدهد؟ براساس مقالهی جدیدی در مورد تشخیص جنسیت خودکار (AGR)، درنظر گرفتن جنسیت بهصورت ارقام دودویی میتواند پیامدهای مخربی برای افراد داشته باشد (برای مثال خشونت جنسی، اشتباه جنسیتی یا حذف هویت را بهدنبال دارد). در نتیجه، بسیاری از روشهای AGR، مفهوم جنسیت را به درستی توضیح نمیدهند.
آیا در خلاصهسازی یا ساخت انتزاع یک شخص، فرض میشود جنسیت او در طول زندگی تغییر نمیکند؟ آیا جنسیت یک معیار روانشناختی است یا ویژگیهای فیزیکی، فاکتور تفکیک جنسیت هستند؟ اگر در این روشها جنسیت بهصورت یک دستهبندی ظاهر نشود، چگونه میتوان به تفسیر نتایج پرداخت؟ بهطورکلی میتوان گفت ترجمهی مفاهیم جهان واقعی به مفاهیم نرمافزاری آنقدر هم که به نظر میرسد، آسان نیست.
مقصود متن در ترجمه
ترجمه اساسا همان عمل تفسیر است. وقتی مترجمها میخواهند متنی را به یک زبان دیگر تبدیل کنند، درواقع بهجای یک نسخهی تحتاللفظی یا المثنی بهدنبال تفسیری از نسخهی اصلی هستند؛ اما این سؤال مطرح میشود که چه فاکتورهایی برای درک متن اصلی لازم است؟
امبرتو اکو به این مسئله، بیان همان چیز میگوید. او معتقد است تشخیص هستهی یک متن یا بنیادیترین عنصر آن، غیرممکن است. رمان مشهور اکو: نام گل سرخ (۱۹۸۰) با ادسو ملک، کشیش سدههای میانه آغاز میشود که انجیل را از حفظ میخواند و مرتکب اشتباهاتی هم میشود. یک مترجم انگلیسی متوجه میشود منظور از چیز در متن کتاب همان انجیل است نه اشتباه آدسو؛ اما مترجم بهجای ترجمهی جملات از زبان آدسو (همانطور که اکو نوشته است)، جملات را بهصورت تحتاللفظی و همانطور که در انجیل ظاهر میشوند، ترجمه میکند.
در این رمان با نثر بازی میشود (کشیش قرن چهاردهم که میتواند انجیل را از حفظ بخواند). صرفنظر از اینکه خطاهای موجود در متون انجیل بهپای اکو یا آدسو نوشته شوند، این خطاها میخواهند پیامی را منتقل کنند اما این پیام کاملا در ترجمه گم شده است. مترجم با ارجاع کلمهی چیز به انجیل، روح اثر را از بین برده است.
اما این تنها ناهنجاری موجود در ترجمهی متون نیست: مترجمها صرفا برای ابعاد مشخصی از متن، اولویت بیشتری قائل هستند. قدیمیترین نسخهی اودیسهی هومر با وزن dactylic hexameter (وزن شعر حماسی یونان باستان، dactylic بهمعنی دو هجای با تأکید و هجای سوم بدون تأکید، hexameters بهمعنی ۶ پایه) نوشته شده است. امروزه، اغلب مترجمها شعر را بدون درنظر گرفتن نظم آن، به نثر روان تبدیل میکنند.
امیلی ویلسون، پژوهشگر آثار کلاسیک که نسخهی اودیسهی او در سال ۲۰۱۸ منتشر شد، با این روش مخالف است. به اعتقاد او حماسهی هومر شعری است که ترجمهی آن باید قابل پیشبینی و دارای ریتم مشخص باشد. ازاینرو از وزن Iambic Parameter (وزنی در ادبیات انگلیسی، iambic بهمعنی هجای اول بدون تأکید، هجای دوم با تأکید pentameter بهمعنی پنجپایه) استفاده میکند که وزن رایج در ادبیات انگلیسی است.
این انتخاب نشاندهندهی باورها و اولویتهای ویلسون است. بعضی مترجمها تنها بر محتوا متمرکز هستند تا فرم (رسیدن به معنای دقیق کلمات و عبارتها) و معتقدند اگر خطوط را در یک ساختار شعری مشخص قرار دهند، معنا دچار انحراف میشود اما به عقیدهی افرادی مثل ویلسون، فرم هم به همان اندازه اهمیت دارد.
حالا دوباره به مثال جنسیت برمیگردیم، در این مثال کل تعاریف و مفاهیم جنسیت به صفر و یکهای دیجیتالی تبدیل میشوند؛ اما این سؤالها مطرح میشود که در چه تعداد از وبسایتها، توسعهدهندگان ویژگیهایی مثل نام، تاریخ تولد و جنسیت را بهعنوان ویژگیهای اصلی معرفی یک شخص درنظر میگیرند؟ و تا چه اندازه از گزینههای دودویی مرد یا زن، برای معرفی جنسیت استفاده میشود؟ آیا این روش ترجمهی شخصیت افراد، مبنای صحیحی دارد؟
جودیث بوتلر در مقدمهی در باب علم نوشتار، اثر ژاک دریدا (فیلسوف و زبانشناس قرن بیستم) مینویسد: یک ترجمه نهتنها زبان مقصد را دستکاری میکند و به آن اضافه میکند بلکه بر زبان مبدأ خود هم تأثیرگذار است. ژان بودریار (فیلسوف و زبانشناس قرن بیستم) در رسالهی خود با عنوان وانمودهها و وانماییها یادآوری میکند: انتزاع امروزی دیگر نقشهی راه، آینه یا مفهوم نیست. امروزه دیگر قلمرو از نقشه بزرگتر نیست. بلکه این نقشه است که از قلمرو هم فراتر میرود. به همین ترتیب در نمونهی گزینههای دودویی جنسیت، بخشی از نوع بشر ادغام یا حذف میشود زیرا مترجم (برنامهنویس) تمرکز خود را بر یک مفهوم دیگر (تفکیک دو جنس) گذاشته است.
کلمه، ترجمهی افکار شما نیست
اصطلاح برنامهنویسی بهمثابه ترجمه بعدها بهدلیل افزایش مفاهیم زبانهای برنامهنویسی و خود زبان انگلیسی، شکل پیچیدهتری به خود گرفت. کلمات بهکاررفته در برنامهها در ظاهر مشابه کلمات زبان انگلیسی هستند اما معنای یکسانی را منتقل نمیکنند.
در مکالمهی معمولی انگلیسی، کاربر به شخصی گفته میشود که با یک برنامه (شیء یا ساختار) کار میکند و دارای ویژگیهای متعدد است. معمولا در گفتوگو با مشتری در مورد کاربران هم بحث میشود. هر برنامه دارای یک گروه کاربر است که نمایندهی اشخاص جهان واقعی و مصرفکنندگان آن هستند.
با پیشرفت گفتوگو، کلمهی کاربر دستخوش تکامل میشود: برای مثال از توصیف کاربران یک وبسایت (ازجمله مشتریان یا تاجرها) تا یک زیرمجموعهی مشخص (مشتریان بهغیر از تاجرها) را در برمیگیرد. صرفنظر از اینکه کاربر را در ابتدای کار چگونه توصیف میکنید، اگر بخواهید تغییر در تعریف کاربر اعمال کنید، باید کد مرتبط با آن را هم بهروزرسانی کنید تا برای برنامه قابلدرک باشد.
کلمهی کاربری که در مکالمهی روزمره به کار میرود، بهمعنی یک شخص واقعی است اما کلمهی کاربر در کد لزوما به این معنی نیست. درواقع یک اصطلاح کدنویسی ممکن است صرفا نشاندهندهی ویژگیهای موردنظر یک توسعهدهنده باشد.
این تعریف برای توسعهدهندگان دیگر یا حتی برای خود برنامهنویس که در آینده به کد خود مراجعه میکند، میتواند معنای متفاوتی داشته باشد یا ممکن است توسعهدهنده در مورد معنای کاربر در جهان واقعی در مقابل معنای آن در یک متن برنامه دچار ابهام شود. وقتی برنامهای را میخوانید، سعی میکنید مفهوم اصلی آن را دریافت کنید و آن را در جهان واقعی تصور کنید؛ اما گاهی این کار امکانپذیر نیست.
دریدا این مشکل را به یک ساختمان خرابه تشبیه میکند. وقتی شخصی سعی میکند برنامه را به یک فرم بامفهوم ترجمه کند، مانند باستانشناسی است که سعی میکند ظاهر اولیهی یک بنای مخروبه را از روی شکل امروزی آن حدس بزند. در دنیای برنامهنویسی، این مشکل در کار با کدهای وراثتی تشدید میشود.
بهعنوان یک برنامهنویس همیشه باید از خود بپرسید: چگونه میتوان موجودیتهای داخل کد را نمایش داد؟ اگر تصمیم بگیرید کد را در آینده بخوانید، آیا میتوانید بهصورت مسئله پی ببرید؟ چگونه میتوان این کد را با دنیای واقعی تطبیق داد؟ همانطور که اکو هم اشاره میکند، این کار بههیچعنوان ساده نیست. پس چاره چیست؟
انعطاف در یافتن معنا
خوشبختانه اکو، راهحلی برای این مشکل پیشنهاد میدهد. بهجای بیان همان نکته، او مترجم را تشویق میکند که از مفهوم تقریبی استفاده کند. معرفی یک کلمهی توصیفی در اینجا ضروری است. اکو در Dire Quasi la Stessa Cosa میگوید:
زمین تقریبا مشابه مریخ است، هر دو به دور خورشید میچرخند و هر دو شکل بیضی دارند اما از آنجا که هر دو مانند کره هستند، میتوان آنها را با پرتقال یا توپ فوتبال هم مقایسه کرد.
با تعریف پارامتر تقریبا میتوان به یک نوع دادوستد یا مبادله در برنامهنویسی رسید. در برنامهنویسی هم نیاز به تعریف یک عنصر مشابه و انعطافپذیر است. افراد معمولا طی مکالمهها انعطافپذیر هستند و به تطبیق و دادوستد کلمات در حین صحبت میپردازند.
استیون سی. اسکینا، الگوریتمی برای ارزانترین پرواز شهر X به شهر Y طراحی کرد. او برای تبدیل این مسئلهی جهان واقعی به برنامه از الگوریتم کوتاهترین مسیر دکسترا استفاده کرد (این الگوریتم به یافتن کوتاهترین مسیر ممکن بین دو گره از یک گراف میپردازد). او باید یک مسئلهی گرافی را حل میکرد اما مشتریها متوجه شدند اسکینا یک مسئلهی مهم را از قلم انداخته است: قوانین هوانوردی و هواپیمایی.
آنها اسکینا را قانع کردند که از روش دیگری برای حل مسئله استفاده کند و اسیکنا هم روش صف اولویت را انتخاب کرد؛ بنابراین باید راهحل قبلی را کنار میگذاشت و بر یادگیری یک راهحل جدید و جایگزین تمرکز میکرد. علاوهبر این، راهحل او برای پاسخگویی به نیازهای مشتری از سرعت کافی هم برخوردار بود؛ بنابراین او مفهوم تقریبا همان چیز را برای حل مسئله درک کرد.
همین ایده را میتوان بر مسئلهی جنسیت یا ایدهی کاربر اعمال کرد؛ بنابراین باید با این نگرش که تغییر و تطبیق اجتنابناپذیر هستند، به کدنویسی پرداخت.
نتیجهگیری
بنابراین با درنظر گرفتن برنامهنویسی بهمثابه ترجمه، چه میتوان آموخت؟ از دیدگاه تجاری، روشهای زیادی برای ترجمهی جهان واقعی به برنامه وجود دارد. تشخیص صحیح مسئله به حل سریع و مستقیم آن کمک میکند.
از دیدگاه برنامهنویسی، ترجمهی جهان واقعی، چشماندازهای یا نسخههای احتمالی را در ذهن توسعهدهندگان به وجود میآورد و در حل مسئله این پرسشها مطرح میشود: آیا انتزاعها یا چکیدهها بهدرستی انتخاب شدهاند؟ آیا برنامهنویسها روی بخش صحیحی از مسئله تمرکز کردهاند؟
از دیدگاه هنجاری و اخلاقی، ترجمهی جهان واقعی و تبدیل آن به کد، بر موجودیتهای جهان واقعی (که در برنامه نمایش داده شدهاند) و همینطور کاربرهایی که با این موجودیتها در ارتباط هستند، تأثیر میگذارد. در مثال کتابخانه، طبقهبندی اشتباه کتابها یا نویسندهها، دسترسی به اطلاعات را غیرممکن میسازد. اشتباه در زندگی یا ویژگیهای افراد هم (مثال جنسیت) تأثیرگذاری مؤلف را بالا میبرند و احتمال اشتباه را بالا میبرد.
بهترین ترجمهها، با اعمال تغییراتی در متن اصلی ممکن میشوند. بهترین برنامهها هم چکیدههای ضروری از واقعیت هستند و مسئولیت بهبود واقعیت قابلنمایش بر عهدهی برنامهنویسها است.
مهندسین سنگاپوری مدتی پیش بهصورت رسمی وبسایت Colourise.sg را راهاندازی کردند. کالرایز که درواقع سرویسی مبتنی بر وب است، توانایی این را دارد که با بهرهگیری از هوش مصنوعی متکی به یادگیری عمیق، تصاویر سیاهوسفید را رنگی کند.
جالب اینجا است که کار با وبسایت موردبحث هیچگونه مهارت فنی لازم ندارد و سرویس این سایت بهصورت رایگان ارائه میشود. درضمن، تبدیل تصاویر سیاهوسفید به تصاویر رنگی در عرض تنها چند ثانیه صورت میپذیرد و نتیجهی کار بهشما نشان داده میشود. نتایج بهدستآمده نیز در اغلب مواقع، بسیار واقعگرایانه و جالب بهنظر میرسند.
پرستون لیم، یکی از مهندسینی که روی این پروژه کار کرده، میگوید یکی از اهداف اصلی او تیمش برای طراحی سرویس کالرایز، رنگیکردن تصاویر تاریخی سیاهوسفید مربوطبه کشور سنگاپور بوده است. جالب است بدانید که سرویس کالرایز از جوانبی با دیگر سرویسهای مشابه مبتنی بر هوش مصنوعی نظیر Algorithmia تفاوت دارد.
البته این سرویس با برخی محدودیتها نیز روبهرو است؛ برای مثال، کاربر نمیتواند خودش رنگ بخشهای مختلف تصویر را مشخص کند. این یعنی نتیجهی نهایی ممکن است در اغلب مواقع، واقعگرایانه بهنظر برسد؛ اما این احتمال وجود دارد که رنگهای آن با رنگهای حقیقی سوژه، تفاوت داشته باشد.
طبق اطلاعات منتشرشده از سوی دستاندرکاران این پروژه، سرویس کالرایز با تصاویری که وضوح بالایی دارند و در آنها سوژههایی نظیر انسان یا مناظر طبیعی وجود دارد، بهتر کار میکند. این سرویس تحتوب دارای یک پایگاه دادهی بزرگ است و براساس اطلاعات موجود در آن، میتواند اشیاء موجود در تصاویر را تشخیص دهد و آنها را رنگی کند.
اگر در تصویری، یک شیء وجود داشته باشد که هوش مصنوعی کالرایز نتواند آن را شناسایی کند، ممکن است نتیجهی نهایی چندان واقعگرایانه نباشد. با مراجعه به این مقاله در وبسایت مدیوم، میتوانید به برخی نتایج بهدستآمده ازطریق این سرویس، دسترسی پیدا کنید.
مینگ چیکو، تحلیلگر معروف اپل معتقد است هدست واقعیت افزوده اپل که تاکنون اخبار مختلفی در مورد آن منتشر شده، اواسط سال ۲۰۲۰ میلادی معرفی خواهد شد. انتظار میرود تولید این هدست افسانهای قبل از پایان سال ۲۰۱۹ میلادی آغاز شود.
از زمانیکه اپل تصمیم گرفت به حوزهی واقعیت افزوده وارد شود و تلاشهای خود را برای طراحی و تولید هدست واقعیت افزوده آغاز کرد، اخبار مختلفی در مورد فناوری محصول جدید کوپرتینونشینها منتشر شده است. مینگ چیکو، تحلیلگر معروف اپل معتقد است عینک واقعیت افزودهی اپل خیلی زودتر از آنچه تصورش را میکنیم به بازار عرضه خواهد شد.
مقالههای مرتبط:
مینگ چیکو در یادداشتی اعلام کرد که تولید انبوه هدست واقعیت افزودهی اپل در فصل چهارم سال ۲۰۱۹ میلادی آغاز خواهد شد. البته بهنظر میرسد این پروسه تا فصل دوم سال ۲۰۲۰ میلادی طول بکشد. هنوز مشخص نیست اپل چه تاریخی را برای رونمایی از عینک واقعیت افزودهی خود انتخاب کرده است، اما تاریخ تولید احتمالا سال ۲۰۲۰ میلادی خواهد بود.
براساس یادداشت منتشرشده از سوی مینگ چیکو، اگر خوشبینانه موضوع را ببینیم، زمان عرضهی هدست واقعیت افزودهی اپل بسیار نزدیک است. در ماه می سال ۲۰۱۸ میلادی، جین مانستر، کارشناس و تحلیلگر شرکت Loup Ventures اعلام کرد اپل تا پایان سال ۲۰۱۲ میلادی اپل هیچ دستگاه پوشیدنی واقعیت افزودهای را به بازار عرضه نخواهد کرد. اما بهنظر میرسد با بازنگری پیشبینیها، این زمان به ماه سپتامبر ۲۰۲۰ تغییر پیدا کرده است. اردیبهشتماه گفته شد که عینک واقعیت افزوده اپل در سال ۲۰۲۱ عرضه میشود.
مینگ چیکو ادعا میکند که نسل اول هدستهای واقعیت افزودهی اپل در اصل شبیه به یک نمایشگر عمل میکنند و تمام پردازشها از جمله نمایش صحنهها، برقراری ارتباط با محتوای واقعیت افزوده و سرویسهای مبتنی بر موقعیت مکانی از جمله GPS، توسط گوشی آیفون بهانجام خواهد رسید. هنوز مشخص نیست برای برقراری ارتباط از کابل میشود یا از ارتباط بیسیم همچون بلوتوث یا وایفای یا سایر فناوریهای ارتباطی بیسیم استفاده خواهد شد.
باتوجه به اینکه بخش سختافزاری، پردازش را ازطریق گوشی آیفون انجام میدهد، درنتیجه انتظار میرود وزن هدست در مقایسه با هدستهای واقعیت مجازی فعلی و حتی هدستهایی که گوشی آیفون یا هر گوشی هوشمند دیگری را بهعنوان نمایشگر مورد استفاده قرار میدهند، بسیار سبکتر باشد.
از آنجایی که عینک واقعیت افزودهی اپل برای تجربهی ARKit مورد استفاده قرار میگیرد، گوشی آیفون توانایی انجام پردازش بالاتری نسبت به هدستی که پردازنده آن متصل به نمایشگر است خواهد داشت. اما ممکن است این سؤال پیش بیاید که ارتباط بین گوشی هوشمند و هدست چگونه برقرار میشود. همچنین ممکن است سوالاتی در مورد پاور مورد نیاز هدست و گوشی آیفون نیز مطرح شود.
پیشتر نیز شایعههایی در مورد عینک واقعیت افزودهی اپل مطرح شده بود. در یکی از اخبار غیررسمی گفته شده بود که هدست واقعیت افزودهی اپل از استاندارد WiGig با فرکانس ۶۰ گیگاهرتز برای برقراری ارتباط با بهره میبرد و از کابل استفاده نمیکند. چنین ارتباطی قطعا باید بتواند از محتوای واقعیت افزوده و سایر اطلاعات مورد نیاز هدست پشتیبانی کند. البته ممکن است هدست در کارکردن با گوشیهای آیفون نسل بعدی که از استاندارد WiGig داخلی پشتیبانی میکنند، با محدودیتهایی مواجه شود. همچنین احتمال دارد برای کارکردن با گوشیهای آیفون قدیمیتر نیز، آداپتور لازم باشد.
پیشتر گفته شده بود که هدست واقعیت افزوده اپل با دو نمایشگر 8K و پشتیبانی از واقعیت مجازی از راه میرسد. چنین مشخصاتی فراتر از سختافزار فعلی اپل و حتی رزولوشنی بسیار بالاتر از هدستهای AR و VR موجود بازار است. هدست ویو پرو برای هر چشم رزولوشنی از ۱۴۴۰ تا ۱۶۰۰ پیکسل ارائه میدهد. بهنظر میرسد باید در مورد رزولوشن بالای نمایشگر به دیدهی شک و تردید نگاه کنیم. از یک طرف چنین رزولوشن بالایی نیاز به گرافیک بالایی دارد که خود مستلزم ارتقا قدرت پردازش گوشیهای آیفون است و از طرفی باید مسائل دیگری از جمله انتقال دادهها را نیز در گوشی آیفون مورد توجه قرار داد.
ابرهای گرد و غبار میان ستارهای و سحابیهای درخشان به وفور در صورت فلکی "شکارچی"(Orion) هستند.
به گزارش ایسنا، صورت فلکی شکارچی اوریون یا جبار، یک صورت فلکی است که روی استوای آسمانی(استوای سماوی) قرار گرفته و بنابراین نیمی از آن در نیمکره جنوبی آسمان و نیم دیگر آن در نیمکرهٔ شمالی آسمان قرار دارد و از همهٔ نقاط زمین قابل دیدن است.
استوای آسمانی یا استوای سماوی(Celestial equator) یک دایرهٔ انگاری(فرضی) در کره آسمان است که همصفحه با استوای زمین است.
یکی از این سحابیهای درخشان، سحابی "مسیه ۷۸ "(M۷۸) است که در کمربند شمالی صورت فلکی "شکارچی"(Orion) قرار دارد.
مسیه ۷۸ یک سحابی بازتابی است که در سال ۱۷۸۰ توسط پیر مِشَن(Pierre Méchain) کشف شد. در اخترشناسی، سحابی بازتابی به ابر میانستارهای گفته میشود که نور ستاره یا ستارگان نزدیک خود را منعکس میکند. نور اگر به اندازهای نباشد که بتواند اتمهای سحابی را یونیزه کند و فقط از طریق پراکندگی بازتاب کند، سحابی بازتابی است اما در صورتی که بتواند یونیزه کند به آن سحابی گسیلشی میگویند. پراکندگی معمولاً باعث میشود که سحابیهای بازتابی به رنگ آبی دیده شوند(نور خورشید نیز توسط جو زمین پراکنده میشود و به همین دلیل آسمان در روز آبی است).
سحابی مسیه ۷۸ که با نام "NGC ۲۰۶۸" نیز شناخته میشود، ۱۵۰۰ سال نوری از زمین فاصله دارد.
یکی از نکات جالب سحابی مسیه ۷۸ این است که در سال ۲۰۰۴ و هنگامیکه ستاره شناسان در حال بررسی "تصویر زمینه گسترده"(wide field image) این سحابی بودند توانستند در دل این سحابی، یک سحابی تازه متولد شده دیگر به نام سحابی "مک نیل "(McNeil) را شناسایی کنند. سحابی "مک نیل" یک "سحابی متغیر"(Variable nebulae ) است. سحابیهای متغیر، سحابیهای بازتابی هستند که درخشش آنها بر اثر موقعیت مکانی ستارگان تغییر میکنند. مشاهده این سحابی در تصاویر آسان نیست و در برخی تصاویر آشکار و برخی تصاویر آشکار نیست. در این تصویر که فوریه ۲۰۱۹ ثبت شده است سحابی مک نیل قابل مشاهده نیست.
فضانوردان "ایستگاه فضایی بینالمللی" تصاویر زیبایی از کره خاکی به ثبت رساندند.
به گزارش ایسنا، یکی از فضانوردان "ایستگاه فضایی بینالمللی" به نام " آن مککلین "( Anne McClain) از فاصله ۲۵۰ مایلی فراز زمین تصاویر زیبایی از طلوع آفتاب به ثبت رسانده است.
"ایستگاه فضایی بینالمللی" که با سرعت ۱۷ هزار و ۵۰۰ مایل بر ساعت در حال گردش به دور زمین است، به فضانوردان مسافر خود این امکان را میدهد که روزانه ۱۶ بار طلوع و غروب آفتاب را نظارهگر باشند.
فضانوردان مستقر در ایستگاه فضایی بینالمللی تحقیقات ارزشمندی انجام میدهند که علاوه بر درک بهتر و بیشتر فضا، به زندگی بهتر روی زمین نیز کمک میکند.
تصاویر زیر عکسهایی است که " آن مککلین " به ثبت رسانده و طلوع تدریجی آفتاب از منظر فضا را نشان میدهد.
پژوهشگران فضاپیمای رباتیک "نیوهورایزنز" (New Horizons) ناسا اخیراً تصویر سه بعدی از دورترین جرم هستی موسوم به "اولتیما تیول"(Ultima Thule) را که بشر تاکنون موفق به رؤیت آن شده، منتشر کردهاند.
به گزارش ایسنا و به نقل از تک تایمز، پژوهشگران فضاپیمای رباتیک "نیوهورایزنز" (New Horizons) ناسا اخیراً تصویر جالب و متفاوت از اولتیما تیول منتشر کردهاند که این تصاویر در طول پرواز تاریخی اول ژانویه ثبت شدهاند.
در این پرواز، فضاپیمای نیوهورایزنز تصاویر مذکور را توسط "دوربین شناسایی دوربرد" (LORRI) و در فاصله ۱۷ هزار و ۴۰۰ مایلی (۲۸ هزار کیلومتری) از اولتیما تیول و از فاصله ۴ هزار و ۱۰۰ مایلی (۶ هزار و ۶۰۰ کیلومتری) از کمربند کویپر ثبت کرده است.
جرم فرانپتونی "اولتیما تیول" یا" MU۶۹ "چهار میلیارد مایل از زمین فاصله دارد و در لبه تاریک منظومه شمسی قرار دارد. خورشید از این مکان بسیار دور است و به همین دلیل میتوان دریافت که این ناحیه نمیتواند درخشانتر از یک ستاره باشد.
از آنجا که اولتیما تیول خیلی از خورشید دور است، بسیار سرد بوده و دمایی در حدود ۳۵ درجه کلوین (منفی ۲۳۸ درجه سانتیگراد) دارد، در حالی که در چنین دمای پایینی، به احتمال زیاد اولتیما در طول زمان تغییر چندانی نکرده است.
کمربند کویپر یک حلقه نازک متشکل از اجرام یخی است و همین موضوع آن را به یکی از اسرارآمیزترین و جالبترین مناطق اطراف خورشید تبدیل کرده است.
این کمربند میلیاردها سال پیش از شکلگیری سیارات منظومه شمسی تشکیل شده است. یک بار از نزدیک مشاهده کردن این کمربند، رؤیای چندین دهه پژوهشگران است.
این تیم با استفاده از ترکیب چند تصویر موفق به ایجاد این تصویر سهبعدی شدهاند.
"جان اسپنسر" (John Spencer) دانشمند پروژه نیوهورایزنز ناسا گفت: ما مدتها منتظر تصاویر با کیفیت از اولتیما تیول بودیم تا با ترکیب این تصاویر بتوانیم تصویر سهبعدی از آن را ایجاد کنیم. اکنون ما میتوانیم از این تصویر سهبعدی به منظور درک بهتر این جسم استفاده کنیم.
Jetpack Aviation پروژهی موتورسیکلت پرندهی خود را تقریبا تمام کرده و از حالا در حال گرفتن سفارش برای این وسیلهی نقلیهی آیندهنگرانه است. این موتورسیکلت از موتور جت استفاده میکند و میتواند به ارتفاع ۱۵ هزار پایی و حداکثر سرعت ۲۴۰ کیلومتر بر ساعت نیز دست پیدا کند. ماندگاری این موتورسیکلت پرنده در آسمان در حدود ۲۰ دقیقه است.
شرکت Jetpack Aviation یا به اختصار JPA، تجربهی زیادی در ساخت پیشرانههای توربین گازی دارد و در سالهای اخیر با اتکا به همین تجربه و توان فنی در حال کار روی پروژهی موتورسیکلت پرندهی خود با نام Speeder بود. در طرح اولیهی این موتورسیکلت پرنده از چهار عدد موتور جت استفاده شده است که مجموع توان رانش آنها به ۷۵۰ پوند بر فوت (۳۱۳۶ نیوتن) میرسد که برا بلندکردن شاسی ۱۰۵ کیلوگرمی این موتورسیکلت به همراه یک خلبان ۱۰۹ کیلوگرمی کفایت میکند.
موتورسیکلت Speeder به سیستم پرواز بدون سیم نیز مجهز بوده و به این ترتیب به یک سیستم حفظ تعادل خودکار مجهز شده است. نحوهی حفظ تعادل وسیلهی نقلیه نیز درست همانند کوادکوپترها انجام میشود. Speeder میتواند با سه نوع سوخت دیزل، JetA و نفت سفید کار کند و بسته به نوع سوخت انتخابی بین ۱۰ تا ۲۲ دقیقه پرواز کند؛ البته این عدد به وزن خلبان و ارتفاع پرواز نیز بستگی دارد.
از امکانات Speeder باید به دو دستهی کنترل، یک نمایشگر ۱۲ اینچی برای سیستم رهیاب ماهوارهای و یک رادیوی هوانوردی ۲ کاناله با قابلیت تماس هوا به هوا و هوا به زمین اشاره کرد. JPA اعلام کرده است که Speeder را در نسخههای مختلفی شامل مدل فوق سبک به تولید خواهد رساند و از استانداردهای FAA نیز بهرهمند خواهد شد. برای هدایت نسخهی فوق سبک Speeder نیاز به هیچگونه گواهینامهای وجود ندارد. البته برای هدایت نسخهی آزمایشی Speeder به گواهینامهی کامل خلبانی نیاز است اما JPA در حال مذاکره با FAA است تا سطح گواهینامهی لازم برای هدایت Speeder را به گواهینامهی خلبانی ورزشی کاهش دهد تا افراد بیشتری بتوانند به سمت آن بروند.
Speeder همانند جت پک ساخت JPA و تختهی پرندهی Zapata Flyboard برای سرعت گرفتن و حرکت رو به جلو باید کمی خم شده و زاویه بگیرد. باید دید در عمل این کار با کنترلرهای Speeder آسان خواهد بود یا نه. سازنده برای ایمنی بیشتر یک سیستم پایداری خودکار برای Speeder طراحی کرده است که حتی در صورت خاموش شدن یکی از موتورهای جت نیز میتواند Speeder را به سلامت فرود بیاورد. بهگفتهی مدیر اجرایی شرکت سازنده برای این وسیله یک سیستم چتر نجات بالستیکی هم طراحی شده و این نشاندهندهی اهمیت بالایی است که JPA به ایمنی میدهد.
موتورسیکلت Speeder فاقد چرخهای تاشونده است و امکان فرود آوردن آن در جادهها وجود ندارد. از نظر سروصدا نیز Speeder با صدای ۱۲۰ دسی بلی خود بسیار پر سروصداتر از یک سوزوکی GSXR است. قیمت تعیینشده برای Speeder نیز ۳۸۰ هزار دلار است که در مقایسه با رقبای آن بسیار بیشتر است. البته در پشت Speeder تجربهی افرادی مانند دیوید میمن و نلسون تیلر وجود دارد که سالها در راه توسعهی جت پکها تلاش کردهاند.
فعلا شرکت سازنده قصد دارد تا تنها ۲۰ دستگاه Speeder تولید کند و برای رزرو آن باید ۱۰ هزار دلار را در ابتدا پرداخت کرد. فعلا نیز تمام این سفارش قرار است در اختیار ارگانها نظامی و امنیتی قرار گیرد. مدل نظامی Speeder تغییراتی نسبت به مدل عادی خواهد داشت و به موتور جت اضافی برای افزایش توان حمل بار و سیستم کنترل از راه دور مجهز خواهد شد تا همانند یک کوادکوپتر بتوان از آن استفاده کرد.
آیا ممکن است در آیندهی نزدیک شرکت بلکبری نیز گوشی هوشمند تاشدنی به بازار عرضه کند؟ در پاسخ به این پرسش باید بگوییم از آنجایی که مدیرعامل بلکبری به آیندهی گوشیهای تاشدنی خوشبین نیست، خیلی بعید بهنظر میرسد این شرکت وارد طراحی و تولید گوشیهای انعطافپذیر شود.
جان چن، مدیرعامل بلکبری در جریان مصاحبهی مطبوعاتی اعلام کرد تقاضای بازار برای خرید گوشیهای تاشدنی محدود است و نوآوریها و خلاقیت زیادی در صنعت سختافزار گوشیهای هوشمند دیده نمیشود. جان چن معتقد است:
من بهدنبال دستگاهی سریعتر با بهبود عملکرد هستم. در حال حاضر چنین دورنمایی در حوزهی صنعت موبایل دیده نمیشود. فناوریهای مربوطبه حسگر اثر انگشت، تشخیص چهره و فناوریهای تشخیص چهره از روی عنبیه توسعه یافتهاند. این روزها هر کسی بهدنبال گوشی هوشمند با نمایشگر بزرگتری است و شاهد معرفی گوشیهای هوشمند بزرگتری در بازار هستیم.
باوجودی که در کنگره جهانی موبایل ۲۰۱۹، گوشیهای هوشمند مختلفی معرفی شدند، اما دو گوشی تاشدنی گلکسی فولد سامسونگ و هواوی میت ایکس از سایر دستگاهها خبرسازتر بودند. میت ایکس، گوشی تاشدنی هواوی با نمایشگر تمامصفحه و مودم 5G معرفی شد. همچنین اول اسفندماه، گلکسی فولد، گوشی تاشدنی سامسونگ معرفی شد. در حالیکه بهنظر میرسد خیلی از شرکتها درصدد تصمیمگیری درمورد نوع طراحی گوشی تاشدنی خود هستند و به این موضوع فکر میکنند که دستگاه تاشدنی بهتر است به داخل بسته شود یا به خارج، مدیرعامل بلکبری به دیدهی شک و تردید به آیندهی بازار گوشیهای هوشمند تاشدنی نگاه میکند. وی معتقد است کاربران بیشتر از آنکه به شکل ظاهری یک گوشی هوشمند توجه کنند، به کارایی دستگاه خود توجه نشان میدهند.
بهنظر میرسد بلکبری برخلاف شرکتهای هواوی، سامسونگ و سایر تولیدکنندگان گوشیهای هوشمند، از طرفداران گوشیهای هوشمند تاشدنی نیست. بلکبری که تحت لوای تیسیال به کار خود ادامه میدهد، همچنان بر تولید گوشیهای هوشمند با امنیت بالاتر تمرکز دارد.
چندی پیش بود که تصاویر جاسوسی از نسل بعدی آئودی A3 منتشر شد و هنوز منتظر دیدن مدل اولیهی این خودرو با پوشش استتاری هستیم. اما این مدل جدید فعلا در دست توسعه قرار دارد و به این زودیها وارد بازار نخواهد شد. زمان باقیمانده تا رونمایی از نسل جدید A3، آئودی را بر آن داشته تا فعلا برنامهها برای بهروزرسانی و ارتقای مدل فعلی را متوقف نکند و به همین دلیل شاهد رونمایی نسخهای جدید از A3 اسپرت بک هستیم که با کد G-tron وارد بازار خواهد شد.
گروه فولکس واگن سرمایهگذاری عظیمی را برای توسعه و تولید خودروهای برقی و هیبریدی انجام داده اما با این وجود این شرکت معتقد است دوران پیشرانههای درونسوز به اتمام نرسیده و هنوز جای برای پیشرفت این موتورها وجود دارد. یکی بخشهایی که فولکس واگن روی آن حساب باز کرده است پیشرانههای گازسوز هستند. گروه فولکس واگن و زیر مجموعههایش خودروهای گازسوز زیادی را در خط تولید خود دارند که از بین آنها میتوان به اشکودا اکتاویا G-TEC، سئات آرونا TGI، فولکس واگن پولو TGI و فولکس واگن گلف TGI اشاره کرد. حالا یک محصول نیز از زیر مجموعهی لوکستر فولکس یعنی آئودی به این گروه اضافه شده است که A3 Sportback G-tron نام دارد.
مقالههای مرتبط:
نسخهی قبلی این خودرو به یک پیشرانهی ۱.۴ لیتری از سری TFSI مجهز بود که ۱۰۹ اسببخار قدرت داشت اما در مدل جدید از یک پیشرانهی ۱.۵ لیتری سری TFSI استفاده شده است که میتواند ۱۲۹ اسببخار قدرت تولید کند. مدل قبلی این آئودی دارای دو مخزن گاز از جنس فایبرگلاس تقویت شده بود که در زیر صندوق عقب نصب شده بودند و فضای زیادی از قسمت بار را اشغال نمیکردند. هر یک از این مخازن میتوانستند حدود ۷ کیلوگرم گاز را درون خود جای دهند.
در مدل جدید اما درکنار مخازن قبلی یک مخزن سوم نیز اضافه شده است که از جنس فولاد بوده و ۴ کیلوگرم ظرفیت دارد. اگر می خواهید بدانید که آئودی این مخزن گاز سوم را چطور در خودرو جای داده، پاسخ شما کوچکتر شدن باک بنزین است. بهطوریکه باک بنزین این خودرو تنها ۹ لیتر ظرفیت دارد. بهگفتهی آئودی با اضافه شدن این مخزن سوم A3 G-tron میتواند با مخازن CNG پر تا ۴۰۰ کیلومتر مسافت را طی کند.
آئودی در حال حاضر فروش این مدل را برای تحویل در سال ۲۰۱۹ آغاز کرده است و برای آن قیمت پایهی ۳۰ هزار دلار تعیین شده است.
.: Weblog Themes By Pichak :.