مایکروسافت از مدل چندوجهی Phi-3-vision با زبان کوچک معرفی کرد
سایر منابع:
سایر خبرها
منظره پشت سر مونالیزا کجاست؟
تابلوی مونالیزای لئوناردو داوینچی پر از رمز و راز است. آن زن که بود؟ حالت مبهم چهره او چه معنایی دارد؟ لئوناردو هنگام خلق این اثر از چه روش هایی استفاده کرد؟ آیا منظره پس زمینه یک مکان واقعی است؟ به گزارش فرادید، حالا، یک زمین شناس مستقل و مورخ هنر می گوید که پاسخ حداقل یک پرسش برجسته در مورد این پرتره معمایی را می داند: پس زمینه! آن پیتسوروسو استدلال می کند که پس زمینه ...
چاپ دیجیتال، یک مفهوم یا یک فن آوری؟
که چاپ سنتی نیز با زمان گوتنبرگ تفاوت های بسیاری کرده است. همان گونه که می دانید، تاریخچه چاپ دیجیتال به زمان اختراع پرینتر (چاپگر) باز می گردد. زمانی که بشر توانست از کامپیوتر بر روی کاغذ خروجی بگیرد و قابلیت ترجمه فایل گرافیکی از کامپیوتر را به زبان ساده قابل فهم یک ماشین الکترو مکانیکی پیدا کند. اما در صنعت چاپ، سال هاست که دارا بودن کیفیت بالا، لازمه استفاده از کلمه چاپ برای یک ...
بیلد 2024؛ تحقق رویاهای بلندپروازانه مایکروسافت
... مدل زبانی کوچک جدید مایکروسافت، تصاویر را درک می کند مطالعه ' 1 Phi-3-vision مدل زبانی چندحالته است و می تواند هم متن و هم تصاویر را درک کند، اما برخلاف DALL-E یا میدجرنی، توانایی تولید تصویر ندارد. مایکروسافت می گوید Phi-3-vision مدلی با 4٫2 میلیارد پارامتر است و می تواند استدلال بصری در هنگام مطرح کردن سؤال درباره ی نمودارها یا تصاویر را انجام دهد. نظر شما ...
هوش مصنوعی Grok ایلان ماسک ظاهراً به زودی چندوجهی می شود
طبق اسناد عمومی توسعه دهندگان شرکت هوش مصنوعی xAI، این شرکت درحال افزودن قابلیت پردازش ورودی های چندوجهی به چت بات Grok خود است. این بدان معناست که به زودی، کاربران ممکن است بتوانند برای Grok تصویر بفرستند تا باتوجه به آن با هوش مصنوعی مکالمه داشته باشند. حدود یک ماه پیش شرکت هوش مصنوعی ایلان ماسک ، یعنی xAI، نسخه Grok-1.5 Vision را معرفی کرد که برای تعدادی از کاربران محدود در دسترس ...
هوش مصنوعی به مرحله درک حالت های ذهنی رسید
است و 75 درصد از وظایف خود را به درستی انجام داده و به گفته کاسینسکی با عملکرد یک کودک شش ساله مطابقت دارد. با این حال، روش های مطالعه کاسینسکی توسط محققان دیگر مورد انتقاد قرار گرفت چرا که آنها در آزمایش های خود به این نتیجه رسیدند که مدل های بزرگ زبانی اغلب به جای استدلال واقعی و مبتنی بر نظریه ذهن، بر اساس روش های اکتشافی سطحی و با استفاده از راه های میان برها، پاسخ ها را ارائه می دهند ...
کلیشه ای به نام حق شهروندی/ سگ گردانی تجاوز به حقوق دیگران
به او درمورد رفتارش تذکر می دهیم، در پاسخ با حالت طلبکارانه و حتی گاه پرخاشگرانه چنین جواب می دهد که مگر الان در شهر ما همه چیز سر جای خودش قرار دهد، اینگونه استدلال ها به ما خاطر نشان می کند که تا حقوق من به صورت تمام براورده نشده نباید انتظار انجام تکالیف مدنی و زیست محیطی و شهروندی را از من انتظار داشته باشید. وی افزود: در عین حال که حق هر شهروند است که دارای زیر ساخت های مناسب شهری باشد ...
هر آنچه در مورد پلی استیشن 6 (PS6) می دانیم و از آن انتظار داریم
توجه به عواملی مانند قیمت و در دسترس بودن عناوین بازی جذاب در زمان عرضه، این واکنش ها به شدت متنوع خواهد بود. هنوز برای صحبت در مورد بازی های نسل بعدی کنسول ها زود است. با این حال، شایعاتی در مورد پی اس 6 و عناوین اولیه آن وجود دارد. ما می دانیم که The Last of Us: Part III هم اکنون در حال توسعه است. مفهوم کلی این بازی تنها در سال 2023 تعریف شد، بنابراین چندین سال توسعه در پیش است. به ...
اورهال خودرو چیست و چه زمانی باید انجام شود؟
را نیز در بر داشته باشد. آیا شما در مورد اورهال یا تعمیر اساسی موتور آگاهی دارید؟ عواملی که باعث می شوند اورهال ضروری باشد چیستند؟ اگر می خواهید به این سؤالات پاسخ دهید، با ما همراه باشید. اورهال خودرو چیست؟ اورهال یا تعمیر اساسی موتور معمولاً زمانی انجام می شود که بخش فنی و قوای محرکه وسیله نقلیه مشکلات جدی داشته باشند. به طور کلی، خودروهای قدیمی با کارکرد بالا نیاز به ...
مایکروسافت از مدل هوش مصنوعی Phi-3-vision رونمایی کرد؛ درک تصاویر و نمودارها
مایکروسافت نسخه جدیدی از مدل زبانی کوچک Phi-3 خود را معرفی کرد که Phi-3-vision نام دارد. این نسخه جدید می تواند به تصاویر نگاه کند و درباره آن اطلاعاتی به شما ارائه کند. Phi-3-vision یک مدل چندوجهی است (به این معنی که می تواند هم متن و هم تصاویر را درک کند) و بهترین استفاده را در گوشی های موبایل ارائه می کند. مایکروسافت می گوید Phi-3-vision که اکنون به صورت پیش نمایش عرضه شده است، یک مدل 4.2 میلیارد پارامتری است که می تواند وظایف استدلال بصری کلی مانند پرسیدن سؤال در مورد نمودارها یا تصاویر را انجام دهد. البته Phi-3-vision به ...
بهترین فیلم های 2024 که منتظرشان هستیم | از ارباب حلقه ها تا مگالوپلیس
اقتباسی از رمانی به همین نام اثر راسل بنکس است که داستان آن دارای شباهت هایی به زندگی پل شریدر است. فیلم آه کانادا داستان هنرمندی را دنبال می کند که در حال مرگ است و در طول آن واقعیت زندگی را می پذیرد. او در دوران جوانی به عنوان چپ گرای کانادایی-آمریکایی برای اجتناب از حضور در جنگ ویتنام به کشور کانادا گریخته است. فیلم Oh, Canada قرار است برای اولین بار در بخش رقابت جشنواره فیلم کن نمایش داده شود و از ...
مدل زبانی کوچک جدید مایکروسافت، تصاویر را درک می کند
ید Phi-3-vision که در حال حاضر به صورت آزمایشی دردسترس است، مدلی با 4٫2 میلیارد پارامتر محسوب می شود و می تواند استدلال بصری در هنگام مطرح کردن سؤال درباره ی نمودارها یا تصاویر را انجام دهد. Phi-3-vision به مراتب کوچک تر از سایر مدل های هوش مصنوعی متمرکز بر تصویر مانند DALL-E یا Stable Diffusion است. برخلاف آن مدل ها، Phi-3-vision تصویر تولید نمی کند؛ اما می تواند آنچه در تصویر وجود دارد، ...
مشترک شوید!
رایانش ابری. طرح هوش مصنوعی آفلاین در دستگاه های اندرویدی محدودیت هایی ایجاد می کند که مهم ترین آن ها، کاهش اندازه ی مدل هوش مصنوعی به حدود 2 تا 3 میلیارد پارامتر است که نسبت به مدل ابری اندازه ی به مراتب کوچک تری خواهد بود. علاوه براین، Context Window محدودتر خواهد شد و این موضوع باعث پایین آمدن عمومیت و دقت پاسخ ها می شود. جمنای نانو انتخاب پایه ای اندروید برای ساخت مدل های ...
آیا شارژ سریع روی عمر باتری تاثیر می گذارد؟
. به خصوص با شارژ سریع، یک شارژ 10 دقیقه ای می تواند بین رفتن به حالت صرفه جویی در مصرف انرژی و قطع کامل برق قبل از رسیدن به خانه تفاوت ایجاد کند. اکنون که شارژ سریع برای گوشی ها به راحتی در دسترس است، ممکن است سؤالاتی مطرح شود: آیا شارژر با ظرفیت بالا می تواند در کوتاه مدت به باتری گوشی شما آسیب برساند؟ آیا با گذشت زمان می تواند قابلیت ذخیره انرژی گوشی شما را کاهش دهد؟ و به هر حال چه ...