سایر منابع:
سایر خبرها
خبرگزاری برنا- گروه علمی و فناوری؛ مایکروسافت جدیدترین پژوهش های خود را در زمینه تبدیل متن به گفتار با مدلی به نام VALL-E نشان داده است که می تواند صدای افراد را تنها از یک نمونه صوتی سه ثانیه ای شبیه سازی کند. محققان شرکت مایکروسافت این مدل چشمگیر جدید هوش مصنوعی تبدیل متن به گفتار را به نحوی طراحی کرده اند که می تواند فقط چند ثانیه به یک صدا گوش دهد، سپس آن صدا را تقلید کند و هرچه ...
خواهد از دستورات برای تولید متن از طریق هوش مصنوعی پیروی کنند. این تا حدودی شبیه به عملکردی است که آفیس قبلاً دارد، اگرچه احتمالا ویژگی OpenAI-back قدرتمندتر از آنچه در حال حاضر در دسترس است خواهد بود. در این گزارش آمده که مهندسان و محققان مایکروسافت بیش از یک سال روی ابزارهای هوش مصنوعی برای ایجاد ایمیل و اسناد کار کرده اند. یکی از عناصر مهم این ویژگی حفظ حریم خصوصی است. اطلاعات توضیح می ...
را دارند. در نتیجه، الگوریتم ها سوگیری های خاص خود را خواهند داشت. فناوری که از گفتار برای تشخیص بیماری استفاده می کند نمونه ای از آن است. کورجی می گوید: موارد زیادی وجود دارد، مثال هایی که شرکت ها نتوانسته اند تفاوت های گفتار در فرهنگ های مختلف را تشخیص دهند. وقتی فناوری مبتنی بر الگوهای گفتاری جمعیتی محدود است، وقتی آن مدل در دنیای واقعی برای جمعیتی متفاوت با لهجه متفاوت اعمال می شود ...
فرهنگ ها نامیده اند. برای نمونه، به جای اینکه فرانسوی ها مدل نحوه معاملات شان را به مردمان آنتیل تحمیل کنند؛ هردوی این مردمان می توانستند مدل های متفاوتی را از یکدیگر فراگیرند. به جای فرآیند دیالکتیکی که می توان فقط از اروپا به جا های دیگر برد؛ این مدل جایگزین امکان روش های احتمالی غنی تر و برخوردار از تکامل دائمی را برای نحوه آرایش حیات انسان فراهم می کند. برده داری، نژادپرستی و تنفر در این نظام ...
...: شاید در آینده ربات های قاتلی که امروزه در فیلم ها می بینیم بتوانند با یک پیشرفت سریع در هوش مصنوعی تبدیل به یک واقعیت شوند. محققان معتقدند که با توجه به سرمایه گذاری هنگفت دولتی و بخش خصوصی در زمینه تولید ربات های هوشمند جنگی، باید وجه منفی عملکرد این تجهیزات کشنده را نیز در نظر گرفت. ممکن است در مورد ربات های قاتل، ربات های سلاخی یا ربات های نابود کننده(که رسماً به آنها سلاح های ...
به گوینده، به طرز چشمگیری از پیشرفته ترین سامانه یادگیری بدون مشاهده نمونه های مشابه برای تولید متن به گفتار (TTS) بهتر عمل می کند . افزون بر این، متوجه شدیم که وال-ای می تواند احساسات و محیط پژواک شناختی صدای گوینده را در خلال تولید صدا درست حفظ کند . از جمله کاربردهای بالقوه آن، خواندن کامل کتاب های صوتی از تنها یک نمونه ضبط شده صدای نویسندگان، ویدیوهایی با صداگذاری به زبان ...