2024-05-09@02:58:54 GMT
۶۳ نتیجه - (۰.۰۰۵ ثانیه)
جدیدترینهای «هوش مصنوعی تبدیل متن»:
بیشتر بخوانید: اخبار اقتصادی روز در یوتیوب
به گزارش خبرگزاری مهر به نقل از اینترستینگ انجینرینگ، استارت آپ چینی شنگشو تکنولوژی و دانشگاه تسینگهوا از هوش مصنوعی «ویدو»(Vidu) رونمایی کرده اند که پاسخی به هوش مصنوعی Sora اوپن ای آی است. این اپلیکیشن تبدیل متن به ویدئو، با یک کلیک کلیپ های ۱۶ ثانیه ای با وضوح ۱۰۸۰ پیکسل می سازد. هرچند این ویدئوها کوتاهتر از محصول ۶۰ ثانیه ای سورا هستند. این نرم افزار جدید تبدیل متن به ویدئو در انجمنی در پکن رونمایی شد. ژو جون محقق ارشد شنگشو و معاون رییس انستیتو هوش مصنوعی دانشگاه تسینگهوا دراین باره می گوید: ویدئو جدیدترین دستاورد یک نوآوری متکی بر خود است و در حوزه های مختلف دستاوردهایی دارد. این سیستم می تواند دنیای فیزیکی را شبیه...
به گزارش خبرگزاری علم و فناوری آنا به نقل از سیجیتیان، مدل هوش مصنوعی بزرگ تبدیل متن به ویدیو که قادر به ایجاد یک ویدیوی ۱۶ ثانیهای با کیفیت بالا و وضوح ۱۰۸۰ p با یک کلیک است، در پکن رونمایی شد. این هوش مصنوعی که با نام «ویدو» (Vidu) شناخته میشود، توسط دانشگاه چینهوا و یک شرکت چینی فعال در حوزه هوش مصنوعی توسعه یافته و نخستین مدل هوش مصنوعی بزرگ تبدیل متن به ویدئو در چین با مدت طولانی، ثبات استثنایی و قابلیتهای پویا است. دانشمندان میگویند، انتظار میرود این شرکت به پیشرفتهای قابل توجهی در تحقیقات پایه و فناوریهای اصلی و کلیدی دست یابد، بنیاد توسعه نسل جدید هوش مصنوعی چین را مستحکم کند و کاربرد این...
به گزارش پارس نیوز ، پیشنمایش مدل هوش مصنوعی تبدیل متن به صوت موسومبه موتور صدا (Voice Engine) را رونمایی کرده است. این مدل با گرفتن نمونهی ۱۵ ثانیهای از صدای یک شخص، میتواند هر متنی را با همان صدا بخواند. هنوز تاریخ عمومیشدن ویس انجین مشخص نشده و انتظار میرود که با توجه به نگرانیها از گسترش دیپ فیک، OpenAI روش استفادهی مسئولانه از این ابزار را برای جلوگیری از هرگونه سوءاستفادهی احتمالی اعلام کند. جف هریس، یکی از اعضای تیم محصول OpenAI، در مصاحبهای گفته است: «ما میخواهیم اطمینان حاصل کنیم که همه در مورد نحوهی بهکارگیری ویس انجین احساس خوبی داشته باشند. ما نسبتبه خطرات این فناوری آگاهیم و برای آن راهحلهایی داریم.» هریس میگوید: «ما نمونهی...
بعد از انقلاب هوش مصنوعی در سال ۲۰۲۲، هر روز اخباری تازه در مورد این فناوری مهم و تاثیر منتشر میشود. فناوریهایی که برخلاف مزایا یا معایب فنیای ویژه خودش، نگرانیهایی را به صورت بالقوه برای محققان به وجود آورده است. از جمله این نگرانیها که توسعه نیز داشته، تغییر و مهندسی انتخابات هر کشوری چه در متن و چه در حاشیه آن میباشد. یکی ازاین قابلیتها، ابزارهای تبدیل متن به فیلم است که توسط شرکت اوپنآی با فناوری هوش مصنوعی ارائه شده است. "هوش مصنوعی سورا" اولین قابلیت تبدیل متن به فیلم توسط شرکت "اوپنآی" باعث ترس و تعجب دانشمندان شده است. چرا که این ابزار، توانایی تولید ویدئوهای واقعی از روی چند متن مختلف را دارد. محققان...
عرضه ابزار هوش مصنوعی تبدیل متن به ویدیو موسوم به سورا (Sora) متعلق به شرکت اُپن ایآی در ماه گذشته با ترکیبی از ترس و هیجان از سوی محققانی مواجه شد که نگران استفاده نادرست از این فناوری بودند. به نقل از نیچر، این شرکت مستقر در کالیفرنیا توانایی سورا را برای ایجاد ویدیوهای واقعی از روی چند متن کوتاه به نمایش گذاشت. تریسی هاروود (Tracy Harwood)، متخصص فرهنگ دیجیتال در دانشگاه دی مونتفورت در لستر، بریتانیا، میگوید که از سرعت توسعه هوش مصنوعیِ تبدیل متن به ویدئو شوکه شده است. یک سال پیش بود که مردم به ویدیوی تولید شده توسط هوش مصنوعی که در آن ویل اسمیت بازیگر آمریکایی در حال خوردن اسپاگتی بود و بسیار غیر...
به گزارش گروه پژوهش و دانش خبرگزاری علم و فناوری آنا؛ ماه گذشته، شرکت اوپناِیآی (OpenAI) از ابزار هوش مصنوعی تبدیل متن به ویدیوی خود با نام سورا (Sora) رونمایی کرد. این رخداد در میان محققان هم با استقبال روبرو شد هم نگرانیهایی را برانگیخت. بسیاری از دانشمندان نگران سوءاستفادههای احتمالی از این فناوری هستند. شرکت اوپنایآی در این رویداد تبلیغاتی، با نمایش توانایی هوش مصنوعی سُرا در تبدیل متن به ویدئو، قابلیتهای این ابزار تازۀ خود را به نمایش گذاشت. یکی از نمونههای تولید شده توسط این ابزار شامل صحنههایی مانند قدم زدن یک زن در خیابانهای توکیو، راه رفتن ماموتها در میان برف و انیمیشن دویدن موجودی پشمالو در برکهای جنگلی بود. تریسی هاروود (Tracy Harwood)، متخصص فرهنگ...
ایتنا - در حال حاضر چندین مدل هوش مصنوعی وجود دارند که دارای درجه بالایی از کنترل و توانایی تولید فیلم در سبکهای هنری مختلف هستند. پس از آن که DALL-E هوش مصنوعی تبدیل متن به تصویر را تولید کرد، دیگر شرکتها قدمی فراتر برداشته و شروع به ساخت مدلهای تبدیل متن به تصویر متفاوتی کردند. در حالی که هنوز هم ممکن است نتایج کمی ناقص به نظر برسند، اما چندین مدل هوش مصنوعی وجود دارند که دارای درجه بالایی از کنترل و توانایی تولید فیلم در سبکهای هنری مختلف هستند. در اینجا شش مدل جدید هوش مصنوعی مناسب تبدیل متن به ویدیو را معرفی میکنیم. Sora شرکت OpenAI خالق چتجیپیتی بهتازگی "سورا"، مدل...
ایتنا - شرکتهایی مانند Runway و Pika مدلهای تبدیلگر متن به ویدیوی تحسینبرانگیز تولیدی خود را معرفی کردند و لومیِر گوگل نیز یکی از رقبای اصلی OpenAI در این فضا به شمار میرود. شرکت OpenAI از قصد خود برای عرضه یک مدل جدید برای تولید ویدئو به نام سورا (Sora) خبر داد. به گزارش ایتنا و به نقل از ورج، این شرکت هوش مصنوعی میگوید سورا «میتواند صحنههای واقعی و تخیلی را از دستورالعملهای متنی خلق کند». این مدل تبدیلگر متن به ویدیو برای کاربران این امکان را فراهم میآورد تا ویدیوهای واقعگرایانه، با طول حداکثر یک دقیقه، ایجاد کنند - همه بر اساس دستورالعملهایی که برای آن نوشتهاند. OpenAI در معرفی این مدل توضیح داده است که...
به گزارش خبرگزاری علم و فناوری آنا به نقل از سیجیتیان، شرکت فناوری اوپنایآی یک مدل هوش مصنوعی به نام «سورا» (Sora) را معرفی میکند که متن را به ویدئو تبدیل میکند. این شرکت اعلام کرد، تحت حمایت مایکروسافت در حال توسعه نرم افزاری است که قادر به تولید ویدیوهای یک دقیقهای بر اساس پیامهای متنی است. این نرم افزار که از کلمه ژاپنی به معنی «آسمان» به نام «سورا» نامگذاری شده است، در حال حاضر برای تیم قرمز در دسترس است که به شناسایی نقصهای سیستم هوش مصنوعی کمک میکند. علاوه بر این، این شرکت برای استفاده هنرمندان تجسمی، طراحان و فیلمسازان برای ارائه بازخورد در مورد مدل در نظر گرفته شده است. در این بیانیه آمده است: سورا...
ایتنا - پژوهشگران استرالیایی میگویند فناوری جدیدی را توسعه دادهاند که میتواند افکار انسان را از طریق پوشیدن یک کلاه مخصوص به متن تبدیل کند. این فناوری که «د ویو» (De Wave) نام دارد، امواج مغزی افراد را از طریق الکتروانسفالوگرام ثبت و آنها را به شکل متنی رمزگشایی میکند. به گفته دانشمندان، پیشرفتهای بیشتر این فناوری در آینده میتواند به بیماران آسیبدیده از سکته مغزی و فلج کمک کند تا بتوانند با محیط اطراف خود ارتباط برقرار کنند و حتی هدایت ماشینهایی مانند بازوهای بیونیک یا رباتها را برعهده بگیرند. چین تنگ لین، دانشمند علوم رایانهای از دانشگاه فناوری سیدنی، میگوید این پژوهش، امواج الکتروانسفالوگرافی را بهطور مستقیم به زبان تبدیل میکند و پیشرفت قابلتوجهی در...
اولین هوش مصنوعی ذهنخوان در جهان، امواج مغزی را به متن قابل خواندن تبدیل میکند. این فناوری شامل یک کلاه مجهز به حسگر است که فعالیت الکتریکی مغز کاربر را در حال فکر کردن مورد بررسی قرار میدهد و آن را به واژه تبدیل میکند. به گزارش ایسنا، این فناوری متحولکننده توسط گروهی از پژوهشگران «دانشگاه فناوری سیدنی» (UTS) ابداع شده است. آنها میگویند این فناوری میتواند مراقبت کردن از بیمارانی که قدرت تکلم خود را به دلیل سکته یا فلج شدن از دست دادهاند، متحول کند. ویدیوی منتشرشده از این فناوری نشان میدهد که یک سوژه انسانی در حال فکر کردن به جملهای است که روی صفحه نمایش نشان داده میشود. سپس مدل هوش مصنوعی، آن را رمزگشایی میکند...
به گزارش خبرگزاری مهر به نقل از نیواطلس، به نظر می رسد امیدی برای افراد دچار سکته و بیمارانی که نمی توانند با ابزارهای معمول با دیگران ارتباط برقرار کنند، به وجود آمده است. این امید در حقیقت توسعه سیستم BrainGPT جدید و آزمایشی است که می تواند افکار کاربران را بخواند و به متن قابل خوانش تبدیل کند. افراد فلج که از «حالت قفل شده» (Lock-In State) رنج می برند نه تنها قادر به تکلم نیستند، بلکه نمی توانند از حرکات دست یا سر برای برقراری ارتباط استفاده کنند. برخی از آنها می توانند چشمان خود را حرکت دهند بنابراین می توانند از سیستم های ارتباطی ردیابی چشم استفاده کنند، اما برخی دیگر حتی این توانایی را هم ندارند....
شرکت OpenAI از نسخه سوم ابزار هوش مصنوعی تبدیل متن به تصویر DALL-E خود رونمایی کرد. هوش مصنوعی DALL-E میتواند پیامهای متنی کاربران را به تصویر تبدیل کند، اما عملکرد دومین نسخه آن با مشکلاتی همراه بود و برخی عبارات خاص را نادیده میگرفت. با این حال اکنون محققان OpenAI اعلام کردهاند که DALL-E ۳ متن کاربران را بسیار بهتر درک میکند.یکی از ویژگیهای جدید DALL-E ۳ ادغام با ChatGPT است. با وجود این ویژگی، دیگر نیازی نیست تا توضیحات دقیقی برای DALL-E ارائه کنید، بلکه میتوانید از ChatGPT بخواهید تا درخواست شما را به آن ارائه کند و با توجه به اینکه DALL-E با جملات طولانیتر عملکرد بهتری از خود ارائه میکند، طبیعتاً این موضوع باعث میشود تا...
تبدیل متن به تصویر یکی از کاربردهای هوش مصنوعی در تولید محتواست. این فناوری به ما امکان میدهد تا تصاویری را از متن ایجاد کنیم که میتواند برای اهداف مختلفی مانند آموزش، سرگرمی و بازاریابی مورد استفاده قرار گیرد. در این مقاله، ۱۰ راهکار برای تبدیل متن به تصویر با هوش مصنوعی را بررسی خواهیم کرد. این راهکارها از ابزارهای ساده آنلاین گرفته تا کتابخانههای Python و مدلهای آموزش دیده شخصی را شامل میشوند. با پیشرفت هوش مصنوعی، انتظار میرود که شاهد کاربردهای جدید و هیجان انگیزتری از این فناوری در زمینه تبدیل متن به تصویر باشیم. استفاده از ابزارهای برخط با استفاده از ابزار آنلاین میتوان برای تبدیل متن به تصویر با هوش مصنوعی استفاده کرد. معمولا کار با...
به گزارش خبرگزاری صدا و سیما، به نقل از مرکز ارتباطات و اطلاعرسانی معاونت علمی، فناوری و اقتصاد دانش بنیان ریاست جمهوری، به گفته محققان، این طرح در حوزه هوش مصنوعی است و طراحی و آزمون هوش مصنوعی از زمینههای مطالعاتی به شمار میرود. این محصول دانشبنیان، یک سکوی جمعسپاری مسائل است. و این سامانه با در اختیار داشتن کاربران فعال در سراسر کشور، خدمات جمعآوری، تگگذاری، جداسازی، اصلاح، انتخاب بر انواع دادههای متنی، صوتی و تصویری را در تمامی قالبها ارائه میکند. به گفته این محقق، جمعسپاری به معنای تقسیم یک کار بین تعداد زیادی از افراد به گونهای که هر فرد بخش کوچکی از آن را انجام دهد. در حال حاضر حدود ۷۰ هزار کاربر در این سکو...
به گزارش همشهری آنلاین، رضا رضازادگان مدیرعامل این شرکت میگوید: «این نرمافزار با استفاده از هوش مصنوعی میتواند نوشتههای فارسی را بهعنوان یک زبان طبیعی، به گفتار تبدیل کند. این نرمافزار با توجه به کاربردهای مختلف آن، توانسته است مورد استفاده مجموعههای مختلف آموزشی، دوبله و متن خوانی، تولید کنندگان کتاب صوتی و شرکت های دیگر قرار گیرد.» او ادامه داد: «این نرمافزار همچنین میتواند به افرادی که توانایی خوانش متون را ندارند، کمک کند؛ به گونهای که حتی نابینان هم میتوانند با استفاده از این نرم افزار، متن را به گفتار تبدیل کرده و از آن استفاده کنند.» رضازادگان گفت: «با توجه به عدم حرکتگذاری کلمات در زبان فارسی از یکسو و وجود کسره اضافه از سوی دیگر، پردازش...
به گزارش گروه علم و پیشرفت خبرگزاری فارس، لومن5 نرم افزاری است که بهترین استفاده را برای ایجاد ویدئوهای جذاب دارد. این نرم افزار با استفاده از هوش مصنوعی به همراه امکانات و توانایی های نرم افزار ویرایش ویدئو قدرت گرفته است. می توانید با مراجعه به وب سایت لومن5 در آدرس www.lumen5.com ثبت نام کنید. هنگامی که در صفحه اصلی هستید، روی دکمه Sign up در گوشه سمت راست بالای صفحه یا Sign up free در وسط کلیک کنید. از شما خواسته می شود آدرس ایمیل، رمز عبور خود را وارد کنید. لومن5سه طرح قیمت گذاری مختلف ارائه می دهد: رایگان، پریمیوم و بیزینس. طرح رایگان ویژگیهای اساسی مانند دسترسی محدود به کتابخانه رسانه، واترمارک روی...
با گسترش سیستم Chat GPT در دنیا برنامههای بسیاری مبتنی بر این سیستم طراحی شده است که برخی از آنها کاملاً رایگان، برخی اشتراکی و تعدادی از آنها کاملاً پولی هستند. سیستم اصلی Chat GPT که توسط شرکت OpenAI طراحی شده است در وبسایت این شرکت برای تمام سیستمعاملها در دسترس است. به گزارش خبرنگار ایمنا، در دهه گذشته، پیشرفتهای چشمگیر در حوزه هوشمصنوعی باعث شده تا این تکنولوژی به عنوان یکی از عوامل کلیدی در توسعه برنامهها و سیستمهای موبایلی شناخته شود. گوشیهای هوشمند اندروید و آیفون به تبدیل رویای هوش مصنوعی به واقعیت کمک کردهاند و به طور فزایندهای از این تکنولوژی برای ارتقای تجربه کاربری، بهینهسازی فرآیندهای مختلف و ایجاد امکانات نوآورانه استفاده میکنند. هوش مصنوعی چیست؟...
مدل هوش مصنوعی جدید CM۳Leon متا مدعی است که در مقایسه با نمونههای رقیب ازجمله مدل DALL-E ۲، بهترین عملکرد را دارد. به گزارش دیجیاتو، طی دو سال اخیر مدلهای هوش مصنوعی تولید تصویر رواج بالایی پیدا کردهاند و موانع فنی استفاده از آنها تقریباً برطرف شده است. البته این بدان معنا نیست که عملکرد این مدلها پایدار شده و به سطح مناسبی رسیده است؛ ولی متا ادعا میکند که با مدل جدید CM۳Leon دستاورد مهمی داشته و بهترین نمونه را در این حوزه ساخته است. متا امروز از مدل هوش مصنوعی جدیدی به نام CM۳Leon (یا همان Chameleon یا «آفتابپرست») رونمایی کرده و میگوید این سیستم میتواند در تبدیل متن به تصویر بهترین عملکرد را به نمایش بگذارد. این...
هوش مصنوعی ابزاری را ارائه کرده است که نقاشی ها و طرحهای اولیه را در چند ثانیه به اثر هنری تبدیل میکند. بسیاری از ما آرزوی هنرمند شدن را در مقطعی از زندگی خود داشتهایم و اکنون این رویا میتواند به لطف ابزارهای هوش مصنوعی که طرحهای خام را به آثار هنری زیبا تبدیل میکند، ممکن شود.در اوایل این هفته، کوالکام از ControlNet رونمایی کرد؛ ابزاری که تصاویر و متن را تنها در ۱۲ ثانیه به آثار هنری تبدیل میکند.برخلاف بسیاری از قالبهای دیگر از این نوع مانند Adobe AI Firef برنامه جدید ControlNet برای کارکرد، نیازی به اینترنت ندارد و به زودی میتواند به یک برنامه اصلی تلفن همراه تبدیل شود.یکی از سخنگویان کوالکام گفت: هوش مصنوعی مولد...
ایتنا - متا با اشاره به «خطرات احتمالی سوء استفاده» با وجود «موارد استفاده بسیار هیجانانگیزی که برای مدلهای گفتار مولد» وجود دارد اعلام کرد که نه اپ Voicebox و نه کد منبع آن در حال حاضر برای استفاده عموم منتشر نمیشود. یک گام دیگر به سمت تحقق دنیای سلبریتیهای بدونمرگ برداشته شد: متا از مدل مولد متن به گفتار خود موسوم به Voicebox، که وعده داده است همان کاری را که ChatGPT و Dall-E برای تولید متن و تصویر انجام دادند برای کلام گفتاری انجام دهد، رونمایی کرد. به گزارش ایتنا و به نقل از انگجت، اساساً این ابزار یک تولیدکننده متن به خروجی است، درست مانند GPT یا Dall-E، فقط به جای ایجاد متن یا تصاویر زیبا،...
شرکت متا اولین مدل هوش مصنوعی خود را در زمینه تبدیل متن به صدا معرفی میکند. شرکت متا اولین پیشنهادات خود در زمینه هوش مصنوعی را از زمان رشد صنعت تولید هوش مصنوعی در اواخر سال ۲۰۲۲ ارائه کرد. انتظار میرود برنامه تبدیل متن به صدای این برند، به نام Voicebox، معادل صوتی ربات ChatGPT باشد که پیامهای متنی را پردازش میکند. Voicebox به نوبه خود قادر به دریافت پیامهای متنی و تولیدکلیپهای صوتی خواهد بود.این برنامه با بیش از ۵۰ هزار ساعت صوت بدون فیلتر، از جمله گفتار و متون حوزه عمومی به زبانهای انگلیسی، فرانسوی، اسپانیایی، آلمانی، لهستانی و پرتغالی آموزش داده شده است.Voicebox مایل به ایجاد نتایج در گفتار مکالمه در انواع زبانهای موجود است. متا...
به گزارش خبرنگار خبرگزاری علم و فناوری آنا، شرکت متا از «ویس باکس» (Voicebox) مدل تبدیل متن به گفتار خود رونمایی کرد. این شرکت وعده میدهد برای تبدیل متن به گفتار همان کاری را انجام میدهد که «چت جی پی تی» (ChatGPT) و «دال ای» (Dall - E) برای تولید متن و تصویر انجام دادند. مدل هوش مصنوعی «ویس باکس» مانند «جی پی تی» یا «دال ای» یک مولد متن به خروجی است، فقط به جای ایجاد متن یا تصاویر زیبا، کلیپهای صوتی را پخش میکند. متا این سیستم را این گونه تعریف میکند: «یک مدل هماهنگساز جریان بهصورت غیرخودکاهنده برای تکمیل صدا براساس زمینه و متن» که این مدل روی بیش از 50 هزار ساعت صدای فیتلرنشده تعلیم یافته...
به گزارش خبرنگار خبرگزاری علم و فناوری آنا، شرکت متا از «ویس باکس» (Voicebox) مدل تبدیل متن به گفتار خود رونمایی کرد. این شرکت وعده میدهد برای تبدیل متن به گفتار همان کاری را انجام میدهد که «چت جی پی تی» (ChatGPT) و «دال ای» (Dall - E) برای تولید متن و تصویر انجام دادند. مدل هوش مصنوعی «ویس باکس» مانند «جی پی تی» یا «دال ای» یک مولد متن به خروجی است، فقط به جای ایجاد متن یا تصاویر زیبا، کلیپهای صوتی را پخش میکند. متا این سیستم را این گونه تعریف میکند: «یک مدل هماهنگساز جریان بهصورت غیرخودکاهنده برای تکمیل صدا براساس زمینه و متن» که این مدل روی بیش از 50 هزار ساعت صدای فیتلرنشده تعلیم یافته...
امین رحمانی، مدیر و بنیان گذار شرکت دانش بنیان «ویراویراست» در گفتگو با خبرنگار ارتباطات و فناوری اطلاعات خبرگزاری علم و فناوری آنا، گفت: ویراویراست شرکتی فعال در حوزه هوش مصنوعی است که با طراحی برنامههای زبانمحور، امکانات خوبی برای کاستیهای فناورانه در زبان فارسی فراهم میکند. پردازشگرهای زبانی، طی سالها آزمون و خطا درک جامعی از عملکرد هوش مصنوعی به ما دادهاند. این درک عمیق به ما این توانایی را میدهد که برای سازمانها راهکارهایی مبتنی بر هوش مصنوعی طراحی کنیم تا در زمان و هزینه صرفهجویی کنند.وی درباره محصولات ارائه شده توسط این شرکت بیان کرد: ما ۴ محصول مبتنی بر هوش مصنوعی طراحی کردهایم. «ویرا تایپ» تایپ گفتاری همزمان است، همانطور که صحبت میکنید برنامه متن شما...
امین رحمانی، مدیر و بنیان گذار شرکت دانش بنیان «ویراویراست» در گفتگو با خبرنگار ارتباطات و فناوری اطلاعات خبرگزاری علم و فناوری آنا، گفت: ویراویراست شرکتی فعال در حوزه هوش مصنوعی است که با طراحی برنامههای زبانمحور، امکانات خوبی برای کاستیهای فناورانه در زبان فارسی فراهم میکند. پردازشگرهای زبانی، طی سالها آزمون و خطا درک جامعی از عملکرد هوش مصنوعی به ما دادهاند. این درک عمیق به ما این توانایی را میدهد که برای سازمانها راهکارهایی مبتنی بر هوش مصنوعی طراحی کنیم تا در زمان و هزینه صرفهجویی کنند.وی درباره محصولات ارائه شده توسط این شرکت بیان کرد: ما ۴ محصول مبتنی بر هوش مصنوعی طراحی کردهایم. «ویرا تایپ» تایپ گفتاری همزمان است، همانطور که صحبت میکنید برنامه متن شما...
امین رحمانی، مدیر و بنیان گذار شرکت دانش بنیان «ویراویراست» در گفتگو با خبرنگار ارتباطات و فناوری اطلاعات خبرگزاری علم و فناوری آنا، گفت: ویراویراست شرکتی فعال در حوزه هوش مصنوعی است که با طراحی برنامههای زبانمحور، امکانات خوبی برای کاستیهای فناورانه در زبان فارسی فراهم میکند. پردازشگرهای زبانی، طی سالها آزمون و خطا درک جامعی از عملکرد هوش مصنوعی به ما دادهاند. این درک عمیق به ما این توانایی را میدهد که برای سازمانها راهکارهایی مبتنی بر هوش مصنوعی طراحی کنیم تا در زمان و هزینه صرفهجویی کنند.وی درباره محصولات ارائه شده توسط این شرکت بیان کرد: ما ۴ محصول مبتنی بر هوش مصنوعی طراحی کردهایم. «ویرا تایپ» تایپ گفتاری همزمان است، همانطور که صحبت میکنید برنامه متن شما...
به گزارش خبرگزاری صداوسیما، برنامه «۶۰ دقیقه» شبکه سی بی اس آمریکا اخیراً پروندهای درباره ابزارهای هوش مصنوعی گوگل داشته و در این برنامه برای اولینبار فناوری تبدیل متن به ویدئوی این شرکت را نشان داده است. این نرمافزار هنوز عمومی نشده است و استفاده از آن محدودیتهایی دارد. گوگل در تکاپو است تا هرچه سریعتر در زمینه هوش مصنوعی به رقبای خود از جمله مایکروسافت برسد. از میان پروژههایی که این شرکت مشغول کار روی آنهاست، ابزار تبدیل متن به ویدئوست که بسیار جذاب بهنظر میرسد و تا پیش از پخش برنامه «۶۰ دقیقه» صحبتی از آن به میان نیامده بود. نرمافزار هوش مصنوعی تولید ویدئو در گوگل فعلاً با نام Phenaki شناخته میشود. این نام احتمالاً با...
به گزارش خبرگزاری صدا و سیما، برنامه «۶۰ دقیقه» شبکه CBS آمریکا اخیراً پروندهای درباره ابزارهای هوش مصنوعی گوگل داشته و در این برنامه برای نخستینبار فناوری تبدیل متن به ویدیوی این شرکت را نشان داده است. این نرمافزار هنوز عمومی نشده است و استفاده از آن محدودیتهایی دارد. گوگل در تلاش است تا هرچه سریعتر در زمینه هوش مصنوعی به رقبای خود ازجمله مایکروسافت برسد. از میان طرحهایی که این شرکت مشغول کار روی آنهاست، ابزار تبدیل متن به ویدیو بسیار جذاب بهنظر میرسد و تا پیش از پخش برنامه «۶۰ دقیقه» صحبتی از آن به میان نیامده بود. نرمافزار هوش مصنوعی تولید ویدیو در گوگل فعلاً با نام Phenaki شناخته میشود. این نام احتمالاً با الهام...
برنامه «۶۰ دقیقه» شبکه CBS آمریکا اخیراً پروندهای درباره ابزارهای هوش مصنوعی گوگل داشته و در این برنامه برای اولین بار فناوری تبدیل متن به ویدیوی این شرکت را نشان داده است. این نرمافزار هنوز عمومی نشده است و استفاده از آن محدودیتهایی دارد. گوگل در تکاپو است تا هرچه سریعتر در زمینه هوش مصنوعی به رقبای خود ازجمله مایکروسافت برسد. از میان پروژههایی که این شرکت مشغول کار روی آنهاست، ابزار تبدیل متن به ویدیو بسیار جذاب بهنظر میرسد و تا پیش از پخش برنامه «۶۰ دقیقه» صحبتی از آن به میان نیامده بود. نرمافزار هوش مصنوعی تولید ویدیو در گوگل فعلاً با نام Phenaki شناخته میشود. این نام احتمالاً با الهام از فَریببین یا فناکیستوسکوپ (Phenakistoscope) انتخاب...
مایکروسافت یکی از سرمایه گذاران اصلی «اوپن آ. آی» است و میلیاردها دلار در این شرکت هزینه میکند. آندرئاس براون مدیر ارشد فناوری شاخه مایکروسافت در آلمان همچنین اعلام کرد در روزهای آینده یک نسخه قدرتمندتر هوش مصنوعی اضافه میشود که پایانی بر گمانه زنیها خواهد بود. او در این باره گفت: ما GPT-۴ را ارائه میکنیم که در آن چند مدل چندگانه قابلیتهای کاملا متفاوتی مانند ویدئو را ارائه میکنند. در این میان گمانه زنی و هیجان درباره مدل آتی هوش مصنوعی مولد اوپن آ. آی بیشتر شده، اما سم آلتمن مدیر ارشد اجرایی این شرکت در مصاحبهای گفت: گویی که مردم میخواهند ناامید شوند و احتمالا نیز میشوند. میرا موراتی مدیر ارشد فناوری «اوپن آ. آی» در...
ایتنا - به گفته آندرئاس براون مدیر ارشد فناوری شاخه مایکروسافت در آلمان در نسخه جدید هوش مصنوعی جی پی تی-۴ متعلق به «اوپن آ. آی» به کاربران اجازه می دهد متن را به ویدئو تبدیل کنند. مایکروسافت یکی از سرمایه گذاران اصلی«اوپن آ. آی» است و میلیاردها دلار در این شرکت سرازیر می کند. براون همچنین اعلام کرد در روزهای آینده یک نسخه قدرتمندتر هوش مصنوعی اضافه می شود که پایانی بر گمانه زنی ها خواهد بود. او در این باره گفت: ما GPT-4 را ارائه می کنیم که در آن چند مدل چندگانه قابلیت های کاملا متفاوتی مانند ویدئو را ارائه می کنند. به گزارش ایتنا و به نقل از مهر، در این میان...
به گفته آندرئاس براون مدیر ارشد فناوری شاخه مایکروسافت در آلمان در نسخه جدید هوش مصنوعی جی پی تی-۴ متعلق به «اوپن آ. آی» به کاربران اجازه می دهد متن را به ویدئو تبدیل کنند. مایکروسافت یکی از سرمایه گذاران اصلی «اوپن آ. آی» است و میلیاردها دلار در این شرکت سرازیر میکند. براون همچنین اعلام کرد: در روزهای آینده یک نسخه قدرتمندتر هوش مصنوعی اضافه میشود که پایانی بر گمانه زنیها خواهد بود. او در این باره گفت: ما GPT-۴ را ارائه میکنیم که در آن چند مدل چندگانه قابلیتهای کاملا متفاوتی مانند ویدئو را ارائه میکنند. در این میان گمانه زنی و هیجان درباره مدل آتی هوش مصنوعی مولد اوپن آ. آی بیشتر شده، اما سم آلتمن مدیر ارشد اجرایی...
به گزارش خبرگزاری مهر به نقل از بیزینس اینسایدر، مایکروسافت یکی از سرمایه گذاران اصلی«اوپن آ. آی» است و میلیاردها دلار در این شرکت سرازیر می کند. براون همچنین اعلام کرد در روزهای آینده یک نسخه قدرتمندتر هوش مصنوعی اضافه می شود که پایانی بر گمانه زنی ها خواهد بود. او در این باره گفت: ما GPT-4 را ارائه می کنیم که در آن چند مدل چندگانه قابلیت های کاملا متفاوتی مانند ویدئو را ارائه می کنند. در این میان گمانه زنی و هیجان درباره مدل آتی هوش مصنوعی مولد اوپن آ. آی بیشتر شده اما سم آلتمن مدیر ارشد اجرایی این شرکت در مصاحبه ای گفت: گویی که مردم می خواهند ناامید شوند و احتمالا نیز می شوند. میرا...
به گزارش خبرگزاری صدا و سیما: OpenAI که بهتازگی دسترسی به ChatGPT را برای کسبوکارها و توسعهدهندگان امکانپذیر کرده، گفته است که API مشابهی برای ابزار Whisper نیز میسازد. Whisper سرویسی بر پایهی هوش مصنوعی است که گفتار را به متن تبدیل میکند. OpenAI همچنین تغییراتی در قوانین استفاده از سرویسهایش برای توسعهدهندگان اعمال کرده است.OpenAI میگوید API جدید ChatGPT صرفاً محدود به اضافه کردن چتبات به اپلیکیشنها نیست و قابلیتهای دیگری نیز دارد. ظاهرا چند شرکت ازجمله اسنپ (توسعهدهندهی اسنپچت) از همین حالا سراغ تزریق ChatGPT به سرویسهای خود رفتهاند.در بخشی از بیانیهی OpenAI آمده که مدل هوش مصنوعی جدید GPT-۳.۵-Turbo «بهترین مدل برای بسیاری از کاربردهای غیر چت است.»آنطور که ورج مینویسد، مدل موردبحث با آنچه مایکروسافت در...
به گزارش گروه بازار خبرگزاری آنا به نقل از روابط عمومی آیگپ، پیامرسان آیگپ در مسیر توسعه و همگام سازی با نمونه های موفق کاربردی و پرطرفدار مشابه در دنیا، پس از برداشتن اولین گام در مسیر هوشمند شدن که همراه با ارائه سومین نسل از این پیامرسان اتفاق افتاد، سرویسهای کاربردی و پرطرفدار TTS و ASR را بروزرسانی کرد. در این بروزرسانی، اتفاقات متفاوتی رخ داده که آیگپ را متمایز از سایر پیامرسانها در مسیر هوشمند شدن قرار داده است. سرویس TTS (تکنولوژی تبدیل متن به گفتار) سرویس TTS (تکنولوژی تبدیل متن به گفتار) در نسخه بروزرسانی شده با قابلیتهای پایه زیر ارائه شده است: • قابلیت خوانش متون فارسی • قابلیت اعرابگذاری خودکار متون • امکان تغییر سرعت...
به گزارش گروه علم و پیشرفت خبرگزاری فارس به نقل از ورج، محققان گوگل سیستم هوش مصنوعی جدیدی را ساختند که میتواند قطعات موسیقی چند دقیقهای را از پیامهای متنی تولید و حتی ملودی سوت یا زمزمه را به سازهای دیگر تبدیل کند. گوگل قطعههای 30 ثانیهای از آنچه شبیه آهنگهای واقعی به نظر میرسد منتشر کرده این قطعات از توضیحات طولانی ایجاد شدهاند. این ویژگی احتمالا برای همه در دسترس نباشد. این مدل MusicLM نام دارد و حتی میتواند صدای انسان را شبیهسازی کند. مطمئناً این مدل اولین سیستم هوش مصنوعی مولد برای آهنگ نیست. تلاشهای دیگری نیز از جمله Riffusion ، Dance Diffusion، AudioML گوگل و Jukebox OpenAI انجام شده است. اما هیچکدام به دلیل محدودیتهای فنی و...
شرکت متا ابزاری جدید در زمینه هوش مصنوعی ابداع کرده است قادر است بر اساس ورودیهای متن، ویدئو تولید کند. به گزارش خبرنگار گروه علمی و فناوری خبرگزاری برنا؛ ابزار هوش مصنوعی شرکت متا که «یک ویدئو بساز» نام دارد، میتواند ویدئوهای کوتاهی را از متن تولید کند. «یک ویدئو بساز» هنوز برای عموم در دسترس نیست. متا این فناوری را به طور رسمی در ماه نوامبر راهاندازی میکند؛ اما به نظر میرسد درست مانند هوشهای مصنوعی که تصویر تولید میکنند، کار کند: شما یک پیام متنی را اضافه میکنید، هر اندازه که دوست دارید آنچه را میخواهید توصیف میکنید و بعد منتظر ویدئو میمانید. فناوری موجود در پس «یک ویدئو بساز» مبتنیبر کارهایی است که هماکنون در تبدیل متن...
خبرگزاری آریا-شرکت متا ابزاری جدید در زمینه هوش مصنوعی ابداع کرده است قادر است بر اساس ورودیهای متن، ویدئو تولید کند.به گزارش خبرگزاری آریا به نقل از وبگاه علمی زدامای ساینس، ابزار هوش مصنوعی شرکت متا که «یک ویدئو بساز» نام دارد، میتواند ویدئوهای کوتاهی را از متن تولید کند که دستاورد چشمگیری است.«یک ویدئو بساز» هنوز برای عموم در دسترس نیست. قرار است متا آن را به طور رسمی در ماه نوامبر راهاندازی میکند؛ اما به نظر میرسد درست مانند هوشهای مصنوعی که تصویر تولید میکنند، کار کند: شما یک پیام متنی را اضافه میکنید، هر اندازه که دوست دارید آنچه را میخواهید توصیف میکنید و بعد منتظر ویدئو میمانید.فناوری موجود در پس «یک ویدئو بساز» مبتنیبر کارهایی...
به گزارش گروه علم و آموزش ایرنا از وبگاه زِداِمای سایِنس (ZME Science)، در هفتههای اخیر، هوشهای مصنوعی تولیدکننده تصویر شکوفا شده و تواناییشان فراتر از آن شده است که چند سال پیش انتظارش را داشتیم. اکنون، الگوریتمها آماده هستند تا همه چیز را به مرحله بعدی ببرند و شروع به تولید ویدئو کنند. تصور کنید «یک سگ با لباس اَبَرقهرمان و شنل قرمز در آسمان پرواز میکند.» این تمام ورودی متنی است که برای تولید کلیپ بالا نیاز دارید. هوش مصنوعی شرکت متا که «یک ویدئو بساز» نام دارد، میتواند ویدئوهای کوتاهی را از متن تولید کند که دستاورد چشمگیری است. «یک ویدئو بساز» هنوز برای عموم در دسترس نیست. قرار است متا آن را به طور رسمی در...
فرارو- متا به تازگی از یک سیستم هوش مصنوعی جدید به نام Make-A-Video رونمایی کرده است. این سیستم به کاربران این امکان را میدهد تا با وارد کردن توضیحات متنی در خصوص یک صحنه، کلیپهای ویدئویی کوتاه تولید کنند. به گزارش فرارو به نقل از rahnamato، متا با ارائه قابلیتهای تولید متن به ویدئو در این سیستم، توانست این فناوری را یک قدم جلوتر ببرد. با این حال، این شرکت هنوز این قابلیت جدید را به صورت عمومی منتشر نکرده است. ویدئوهای ایجاد شده توسط این سیستم، پنج ثانیه یا کوتاهتر هستند و هیچ گونه صدایی ندارند. اما متا ادعا میکند که طیف گستردهای از دستورات توسط این هوش مصنوعی پشتیبانی میشود. متا در یک پست وبلاگی اعلام کرده که...
این ترفند بسیار هیجانانگیز است و به کاربران امکان میدهد تصاویر و آثار هنری را به کمک محتوای تولید شده توسط هوش مصنوعی گسترش دهند. شرکت (Open AI)، یک شرکت توسعه دهنده مولد متن به تصویر (DALL- E ۲) به تازگی ویژگی جدیدی را برای این برنامه به نام "خارج سازی" ایجاد کرده است. این قابلیت جدید، به کاربران امکان میدهد تصاویر و آثار هنری را به کمک محتوای تولید شده توسط هوش مصنوعی گسترش دهند. این ترفند بسیار هیجان انگیز است و قابلیتهای ابزاری را به شدت گسترش میدهد. این ابزار یکی از محبوبترین مولدهای تبدیل متن به تصویر است که در حال حاضر موجود است. با بیش از یک میلیون کاربر جای تعجب نیست که محتوای ایجاد شده...
فرارو-پلتفرم ویدئویی تیک تاک اخیرا افکت جدیدی به نام «AI greenscreen» را به اپلیکیشن خود اضافه کرده است که امکان تبدیل پیام متنی کاربران را به تصویر فراهم میکند. کاربران سپس میتوانند از این تصویر به عنوان پس زمینه تصاویر استفاده کنند. به گزارش فرارو، خروجی این سیستم درمقایسه با مدلهای پیشرفته تبدیل متن به تصویر مانند Imagen گوگل، هوش مصنوعی DALL-E2 شرکت OpenAI یا نرم افزار Midjourney بسیار ابتدایی به نظر میرسد. این افکت قادر است تصاویر نسبتاً انتزاعی و چرخشی را ایجاد کند. نرم افزارهای پیشرفتهتر میتوانند هم تصاویر فوتورئالیستی و هم تصاویر پیچیده و منسجمی که به نظر میرسد توسط انسان طراحی یا نقاشی شدهاند را تولید کنند. اگرچه ممکن است وجود این محدودیتها توسط تیک...
عصر ایران - طی چند سال اخیر شاهد تغییری اساسی در روند تولید تصاویر بوده ایم. در همین راستا، ورود و رشد یادگیری ماشینی و هوش مصنوعی پرسش هایی را در مورد نحوه تکامل و توسعه فرایندهای خلاق از طریق فناوری ایجاد کرده اند. سامانه هایی مانند دال-ئی (DALL-E)، دال-ئی 2 (DALL-E 2) و میدجرنی (Midjourney) برنامه های هوش مصنوعی هستند که برای ایجاد تصاویر بر مبنای توضیحات متنی با استفاده از مجموعه داده شکل گرفته اند. با استفاده از این سامانه ها طیف متنوعی از قابلیت ها مانند ایجاد جنبه های انسانی برای حیوانات و اشیا، ترکیب مفاهیم نامرتبط به روش های قابل قبول، و اعمال دگرگونی های مختلف در تصاویر در دسترس قرار گرفته اند. دال-ئی و...
گوگل از سیستم هوش مصنوعی جدیدی پرده برداشته که میتواند با دریافت متن تصویر خلق کند. این سیستم در واقع به کاربر اجازه میدهد تا با نوشتن یک متن توصیفی از طریق هوش مصنوعی معادل تصویری آن را ببیند. این شرکت مدعی است که مدل Imagen دارای سطح بیبدیلی از واقعگرایی و درک عمیقی از زبانهاست. مدل هوش مصنوعی گوگل به راحتی توسط همه کاربران قابل استفاده است. برای مثال اگر بنویسید «تصویر یک گربه پرشین که کلاه گاوچرانی به سر گذاشته، پیراهن قرمز پوشیده و در ساحل گیتار میزند» تصویر زیر به دست میآید. گوگل میگوید در مقایسهای که بین مدل خود و سایر مدلهای مشابه داشته، فهمیده که کاربران دقت و صحت تصاویر را در این مدل بیشتر...
گوگل یک هوش مصنوعی متن به تصویر جدید دارد که به گفته این شرکت رقبا را شکست میدهد. این برنامه که Imagen نام دارد، متنی را دریافت میکند و توصیف آن را به صورت عکس خروجی میدهد. به گزارش cnet، قابلیت Imagen از دیگر مولدهای تبدیل متن به تصویر مانند مدلهای DALL-E، VQ-GAN+CLIP و Latent Diffusion پیروی میکند. هنگامی که از گوگل خواسته شد تصاویر ایجاد شده توسط Imagen و سایر تولیدکنندگان متن به تصویر را مقایسه کند، مردم دریافتند که مدل گوگل از رقبای خود در دقت و وفاداری به متن، تصویر بهتری ایجاد میکند. گوگل چندین نمونه از پیامهای متنی و تصاویر حاصل از هوش مصنوعی را در وب سایت Imagen خود به اشتراک گذاشت. مدلهای یادگیری متن...
ایتنا- کمپانی مایکروسافت پس از مدتها انتظار هوش مصنوعی تبدیل متن به گفتار خود را به صورت محدود در اختیار برخی از کاربران مشتاق قرار داده است. کمپانی مایکروسافت پس از مدتها انتظار هوش مصنوعی تبدیل متن به گفتار خود را به صورت محدود در اختیار برخی از کاربران مشتاق قرار داده است. به گزارش ایتنا و به نقل از Engadget، مایکروسافت به تازگی مجوز دسترسی اولیه به هوش مصنوعی تبدیل متن به گفتار ویژهای به نام Custom Neural Voice را صادر کرده است. توسعه دهندگان با استفاده از این هوش مصنوعیمی توانند صوتهای مصنوعی شخصی سازی شدهای ایجاد کنند. فناوری یاد شده بخشی از سرویس هوش مصنوعی آژور به نام Speech است. کمپانیمی توانند از این فناوری برای...
محققان هوش مصنوعی در تلاش اند تا با استفاده از این فناوری بتوانند افکار انسان را خوانده و آن را به متن تبدیل کنند. به گزارش خبرنگار حوزه علم، فناوری و دانش بنیان گروه دانشگاه خبرگزاری آنا،دورانی را تصور کنید که بتوانید افکار شخص را از طریق تله پاتی بخوانید و از برنامههای خوب یا بد آنها پرده بردارید، یا فنی که افکار یک شخص ساکت (کسی که حرف نمیزند و یا اختلال گفتاری دارد) یا حیوانات خانگی شمارا بخواند و به شما در برقراری ارتباط بهتر کمک کند. بله، تیمی در دانشگاه کالیفرنیا، این آزمایش را انجام دادند و ما را یکقدم به این رؤیا نزدیکتر کردند. جوزف ماکین، یک از اعضای تیم تحقیق گفت: ما هنوز به...
به گزارش خبرنگار حوزه دریچه فناوری گروه فضای مجازی باشگاه خبرنگاران جوان، شرکت بزرگ مایکروسافت با ارتقا سیستم هوش مصنوعی خود، آن را به گونهای توسعه داده است که به خوبی با کاربر هماهنگ شد و پس از مدت کوتاهی تمرین، قادر به ارائه یک سخنرانی کامل و واقعگرایانه به کاربر خود است. بیشتر بخوانید: لذت تماشای دنیایی متفاوت با بازی Earth Minecraft +فیلم تبدیل متن به گفتار روشی هوشمندانه در ارتقا کیفیت هرچه بیشتر سخنرانیها یا رائه کنفرانسهای علمی است ولی در این مسیر هنوز هم مشکلاتی وجود دارد. یکی از بارزترین این مشکلات زمان زیادی است که نرمافزارهای تبدیل متن به گفتار برای هماهنگی کامل با کاربر و ارائه فایل صوتی با صدای طبیعی، نیاز دارند. حال مهندسان...
ایتنا -محققان چینی و مایکروسافت یک سیستم هوش مصنوعی برای تبدیل متن به صوت ابداع کردهاند که با کمک ۲۰۰ نمونه یک فایل صوتی بسیار طبیعی تولید کند. فناوری تبدیل متن به صوت هر روز هوشمندتر میشود اما هنوز مشکلی در مسیر پیشرفت آن وجود دارد. این فناوری هنوز هم نیازمند مدت زمان آموزش و منابع زیادی است تا بتواند بازدهی طبیعیتر ارائه کند. در همین راستا به نظر میرسد محققان چینی و مایکروسافت راه حلی ایده آل برای این امر یافته اند. آنها یک سیستم هوش مصنوعی تبدیل متن به صوت ابداع کردهاند که میتواند فقط با کمک ۲۰۰ نمونه صوتی (معادل ۲۰ دقیقه)، فایل صوتی طبیعی تولید کند. این سیستم به شبکههای عصبی عمیقی تکیه دارد که عملکرد نورونهای...
فناوری تبدیل متن به صوت هر روز هوشمندتر میشود اما هنوز مشکلی در مسیر پیشرفت آن وجود دارد. این فناوری هنوز هم نیازمند مدت زمان آموزش و منابع زیادی است تا بتواند بازدهی طبیعیتر ارائه کند. در همین راستا به نظر میرسد محققان چینی و مایکروسافت راهحلی ایده آل برای این امر یافتهاند. آنها یک سیستم هوش مصنوعی تبدیل متن به صوت ابداع کردهاند که میتواند فقط با کمک 200 نمونه صوتی (معادل 20 دقیقه)، فایل صوتی طبیعی تولید کند. این سیستم به شبکههای عصبی عمیقی تکیه دارد که عملکرد نورونهای مغز را تقلید میکنند. این شبکه عصبی عمیق هر اطلاعات ورودی و خروجی را روی لینکهای سیناپسی میسنجد و به این ترتیب به آنها کمک میکند هر...
محققان چینی و مایکروسافت به تازگی یک سیستم هوش مصنوعی برای تبدیل متن به صوت ابداع کردهاند که با کمک 200 نمونه یک فایل صوتی بسیار طبیعی تولید کند.به گزارش بلاغ،به نقل از انگجت، محققان چینی و مایکروسافت یک سیستم هوش مصنوعی برای تبدیل متن به صوت ابداع کرده اند که با کمک 200 نمونه یک فایل صوتی بسیار طبیعی تولید کند. در حالیکه سیستمهای مختلفی در تلاش هستند تا فناوری تبدیل متن به صوت پیشرفت کند اما مشکلات بسیاری سر راه این هوشمندسازی قرار دارند که منجر به اتلاف هزینه و وقت زیادی میشوند. محققان چینی و مایکروسافت برای حل این مشکلات یک سیستم هوش مصنوعی ابداع کردهاند که با کمک 200 نمونه فایل صوتی که معادل در نهایت...
به گزارش خبرگزاری مهر به نقل از انگجت، فناوری تبدیل متن به صوت هر روز هوشمندتر میشود اما هنوز مشکلی در مسیر پیشرفت آن وجود دارد. این فناوری هنوز هم نیازمند مدت زمان آموزش و منابع زیادی است تا بتواند بازدهی طبیعیتر ارائه کند. در همین راستا به نظر میرسد محققان چینی و مایکروسافت راه حلی ایده آل برای این امر یافته اند. آنها یک سیستم هوش مصنوعی تبدیل متن به صوت ابداع کرده اند که میتواند فقط با کمک ۲۰۰ نمونه صوتی (معادل ۲۰ دقیقه)، فایل صوتی طبیعی تولید کند. این سیستم به شبکههای عصبی عمیقی تکیه دارد که عملکرد نورونهای مغز را تقلید میکنند. این شبکه عصبی عمیق هر اطلاعات ورودی و خروجی را روی لینکهای سیناپسی میسنجد...
هوش مصنوعی مفهوم جدیدی است که از طرح آن چند سالی بیشتر نمیگذرد. این فناوری نوین با تاثیر چشمگیری که داشته، توانسته زندگی روزمره را راحتتر کند. خانههای هوشمند و تجهیزات اداری، تجاری و دیجیتال هوشمند نمونههایی از استفاده از قابلیتهای هوش مصنوعی در دنیای مدرن است. امروزه بهراحتی از زمان حرکت با خودرو میتوانید با استفاده از سیستمهای ترافیکی هوشمند، مسیرهای پرترافیک را از خانه تا محل کار با نقشههای هوشمند کنترل کرده و خلوتترین مسیرها را برای تردد انتخاب کنید.اما این تحول تنها به این موارد ختم نمیشود، از هوش مصنوعی در عرصه آموزش در دانشگاهها هم میتوان استفاده کرد. با ورود هوش مصنوعی به دانشگاهها و سیستمهای آموزش عالی، موسسات آموزشی موظفند فناوریهای نوین مرتبط با این...
خبرگزاري آريا - گوگل نيز همانند هر شرکت ديگري، مي خواهد خروجي گفتاري محصولاتش تا جاي ممکن واقعي و طبيعي به نظر برسد. براي حصول اين نتيجه مي توان از يک هنرپيشه معروف و خوش صدا (مثلاً اسکارلت يوهانسون) بخواهيم تمام کلمات و عبارات و آواهاي مختلف را ادا کند و سپس با استفاده از نرم افزاري پيچيده آنها را با هم ترکيب نماييم، اما اين روش براي گوگل چندان هيجان انگيز نيست.غول تکنولوژي مانتن ويو به تازگي از سامانه جديدي تحت عنوان «تاکوترون» (Tacotron) رونمايي کرده که از فنون يادگيري عميق (deep learning) براي تبديل نوشته به گفتار بهره مي گيرد. تاکوترون قادر است ويژگي هاي عروضي (تُن و آهنگ موسيقايي گفتار) را رعايت کند، ابهام معنايي (مانند...