Web Analytics Made Easy - Statcounter
2024-05-09@02:58:54 GMT
۶۳ نتیجه - (۰.۰۰۵ ثانیه)

جدیدترین‌های «هوش مصنوعی تبدیل متن»:

بیشتر بخوانید: اخبار اقتصادی روز در یوتیوب
    به گزارش خبرگزاری مهر به نقل از اینترستینگ انجینرینگ، استارت آپ چینی شنگشو تکنولوژی و دانشگاه تسینگهوا از هوش مصنوعی «ویدو»(Vidu) رونمایی کرده اند که پاسخی به هوش مصنوعی Sora اوپن ای آی است. این اپلیکیشن تبدیل متن به ویدئو، با یک کلیک کلیپ های ۱۶ ثانیه ای با وضوح ۱۰۸۰ پیکسل می سازد. هرچند این ویدئوها کوتاهتر از محصول ۶۰ ثانیه ای سورا هستند. این نرم افزار جدید تبدیل متن به ویدئو در انجمنی در پکن رونمایی شد. ژو جون محقق ارشد شنگشو و معاون رییس انستیتو هوش مصنوعی دانشگاه تسینگهوا دراین باره می گوید: ویدئو جدیدترین دستاورد یک نوآوری متکی بر خود است و در حوزه های مختلف دستاوردهایی دارد. این سیستم می تواند دنیای فیزیکی را شبیه...
    به گزارش خبرگزاری علم و فناوری آنا به نقل از سی‌جی‌تی‌ان، مدل هوش مصنوعی بزرگ تبدیل متن به ویدیو که قادر به ایجاد یک ویدیوی ۱۶ ثانیه‌ای با کیفیت بالا و وضوح ۱۰۸۰ p با یک کلیک است، در پکن رونمایی شد. این هوش مصنوعی که با نام «ویدو» (Vidu) شناخته می‌شود، توسط دانشگاه چینهوا و یک شرکت چینی فعال در حوزه هوش مصنوعی توسعه یافته و نخستین مدل هوش مصنوعی بزرگ تبدیل متن به ویدئو در چین با مدت طولانی، ثبات استثنایی و قابلیت‌های پویا است. دانشمندان می‌گویند، انتظار می‌رود این شرکت به پیشرفت‌های قابل توجهی در تحقیقات پایه و فناوری‌های اصلی و کلیدی دست یابد، بنیاد توسعه نسل جدید هوش مصنوعی چین را مستحکم کند و کاربرد این...
    به گزارش پارس نیوز ، پیش‌نمایش مدل هوش مصنوعی تبدیل متن به صوت موسوم‌به موتور صدا (Voice Engine) را رونمایی کرده است. این مدل با گرفتن نمونه‌ی ۱۵ ثانیه‌ای از صدای یک شخص، می‌تواند هر متنی را با همان صدا بخواند. هنوز تاریخ عمومی‌شدن ویس انجین مشخص نشده و انتظار می‌رود که با توجه به نگرانی‌ها از گسترش دیپ فیک، OpenAI روش استفاده‌ی مسئولانه از این ابزار را برای جلوگیری از هرگونه سوءاستفاده‌ی احتمالی اعلام کند. جف هریس، یکی از اعضای تیم محصول OpenAI، در مصاحبه‌ای گفته است: «ما می‌خواهیم اطمینان حاصل کنیم که همه در مورد نحوه‌ی به‌کارگیری ویس انجین احساس خوبی داشته باشند. ما نسبت‌به خطرات این فناوری آگاهیم و برای آن راه‌حل‌هایی داریم.» هریس می‌گوید: «ما نمونه‌ی...
    بعد از انقلاب هوش مصنوعی در سال ۲۰۲۲، هر روز اخباری تازه در مورد این فناوری مهم و تاثیر منتشر می‌شود. فناوری‌هایی که برخلاف مزایا یا معایب فنی‌ای ویژه خودش، نگرانی‌هایی را به صورت بالقوه برای محققان به وجود آورده است. از جمله این نگرانی‌ها که توسعه نیز داشته، تغییر و مهندسی انتخابات هر کشوری چه در متن و چه در حاشیه آن می‌باشد. یکی ازاین قابلیت‌ها، ابزارهای تبدیل متن به فیلم است که توسط شرکت اوپن‌آی با فناوری هوش مصنوعی ارائه شده است. "هوش مصنوعی سورا" اولین قابلیت تبدیل متن به فیلم توسط شرکت "اوپن‌آی" باعث ترس و تعجب دانشمندان شده است. چرا که این ابزار، توانایی تولید ویدئوهای واقعی از روی چند متن مختلف را دارد. محققان...
    عرضه ابزار هوش مصنوعی تبدیل متن به ویدیو موسوم به سورا (Sora) متعلق به شرکت اُپن ای‌آی در ماه گذشته با ترکیبی از ترس و هیجان از سوی محققانی مواجه شد که نگران استفاده نادرست از این فناوری بودند. به نقل از نیچر، این شرکت مستقر در کالیفرنیا توانایی سورا را برای ایجاد ویدیو‌های واقعی از روی چند متن کوتاه به نمایش گذاشت. تریسی هاروود (Tracy Harwood)، متخصص فرهنگ دیجیتال در دانشگاه دی مونتفورت در لستر، بریتانیا، می‌گوید که از سرعت توسعه هوش مصنوعیِ تبدیل متن به ویدئو شوکه شده است. یک سال پیش بود که مردم به ویدیوی تولید شده توسط هوش مصنوعی که در آن ویل اسمیت بازیگر آمریکایی در حال خوردن اسپاگتی بود و بسیار غیر...
    به گزارش گروه پژوهش و دانش خبرگزاری علم و فناوری آنا؛ ماه گذشته، شرکت اوپن‌اِی‌آی (OpenAI) از ابزار هوش مصنوعی تبدیل متن به ویدیوی خود با نام سورا (Sora) رونمایی کرد. این رخداد در میان محققان هم با استقبال روبرو شد هم نگرانی‌هایی را برانگیخت. بسیاری از دانشمندان نگران سوء‌استفاده‌های احتمالی از این فناوری هستند. شرکت اوپن‌ای‌آی در این رویداد تبلیغاتی، با نمایش توانایی هوش مصنوعی سُرا در تبدیل متن به ویدئو، قابلیت‌های این ابزار تازۀ خود را به نمایش گذاشت. یکی از نمونه‌های تولید شده توسط این ابزار شامل صحنه‌هایی مانند قدم زدن یک زن در خیابان‌های توکیو، راه رفتن ماموت‌ها در میان برف و انیمیشن دویدن موجودی پشمالو در برکه‌ای جنگلی بود. تریسی هاروود (Tracy Harwood)، متخصص فرهنگ...
    ایتنا - در حال حاضر چندین مدل هوش مصنوعی وجود دارند که دارای درجه بالایی از کنترل و توانایی تولید فیلم در سبک‌های هنری مختلف هستند.  پس از آن که DALL-E هوش مصنوعی تبدیل متن به تصویر را تولید کرد، دیگر شرکت‌ها قدمی فراتر برداشته و شروع به ساخت مدل‌های تبدیل متن به تصویر متفاوتی کردند. در حالی که هنوز هم ممکن است نتایج کمی ناقص به نظر برسند، اما چندین مدل هوش مصنوعی وجود دارند که دارای درجه بالایی از کنترل و توانایی تولید فیلم در سبک‌های هنری مختلف هستند. در اینجا شش مدل جدید هوش مصنوعی مناسب تبدیل متن به ویدیو را معرفی می‌کنیم.     Sora شرکت OpenAI خالق چت‌جی‌پی‌تی به‌تازگی "سورا"، مدل...
    ایتنا - شرکت‌هایی مانند Runway و Pika مدل‌های تبدیل‌گر متن به ویدیوی تحسین‌برانگیز تولیدی خود را معرفی کردند و لومیِر گوگل نیز یکی از رقبای اصلی OpenAI در این فضا به شمار می‌رود. شرکت OpenAI از قصد خود برای عرضه یک مدل جدید برای تولید ویدئو به نام سورا (Sora) خبر داد.   به گزارش ایتنا و به نقل از ورج، این شرکت هوش مصنوعی می‌گوید سورا «می‌تواند صحنه‌های واقعی و تخیلی را از دستورالعمل‌های متنی خلق کند». این مدل تبدیل‌گر متن به ویدیو برای کاربران این امکان را فراهم می‌آورد تا ویدیوهای واقع‌گرایانه، با طول حداکثر یک دقیقه، ایجاد کنند - همه بر اساس دستورالعمل‌هایی که برای آن نوشته‌اند.   OpenAI در معرفی این مدل توضیح داده است که...
    به گزارش خبرگزاری علم و فناوری آنا به نقل از سی‌جی‌تی‌ان، شرکت فناوری اوپن‌ای‌آی یک مدل هوش مصنوعی به نام «سورا» (Sora) را معرفی می‌کند که متن را به ویدئو تبدیل می‌کند. این شرکت اعلام کرد، تحت حمایت مایکروسافت در حال توسعه نرم افزاری است که قادر به تولید ویدیو‌های یک دقیقه‌ای بر اساس پیام‌های متنی است. این نرم افزار که از کلمه ژاپنی به معنی «آسمان» به نام «سورا» نامگذاری شده است، در حال حاضر برای تیم قرمز در دسترس است که به شناسایی نقص‌های سیستم هوش مصنوعی کمک می‌کند. علاوه بر این، این شرکت برای استفاده هنرمندان تجسمی، طراحان و فیلمسازان برای ارائه بازخورد در مورد مدل در نظر گرفته شده است. در این بیانیه آمده است: سورا...
    ایتنا - پژوهشگران استرالیایی می‌گویند فناوری جدیدی را توسعه داده‌اند که می‌تواند افکار انسان را از طریق پوشیدن یک کلاه مخصوص به متن تبدیل کند. این فناوری که «د ویو» (De Wave) نام دارد، امواج مغزی افراد را از طریق الکتروانسفالوگرام ثبت و آن‌ها را به شکل متنی رمزگشایی می‌کند. به گفته دانشمندان، پیشرفت‌های بیشتر این فناوری در آینده می‌تواند به بیماران آسیب‌دیده از سکته مغزی و فلج کمک کند تا بتوانند با محیط اطراف خود ارتباط برقرار کنند و حتی هدایت ماشین‌هایی مانند بازو‌های بیونیک یا ربات‌ها را برعهده بگیرند. چین تنگ لین، دانشمند علوم رایانه‌ای از دانشگاه فناوری سیدنی، می‌گوید این پژوهش، امواج الکتروانسفالوگرافی را به‌طور مستقیم به زبان تبدیل می‌کند و پیشرفت قابل‌توجهی در...
    اولین هوش مصنوعی ذهن‌خوان در جهان، امواج مغزی را به متن قابل خواندن تبدیل می‌کند. این فناوری شامل یک کلاه مجهز به حسگر است که فعالیت الکتریکی مغز کاربر را در حال فکر کردن مورد بررسی قرار می‌دهد و آن را به واژه تبدیل می‌کند. به گزارش ایسنا، این فناوری متحول‌کننده توسط گروهی از پژوهشگران «دانشگاه فناوری سیدنی» (UTS) ابداع شده است. آن‌ها می‌گویند این فناوری می‌تواند مراقبت کردن از بیمارانی که قدرت تکلم خود را به دلیل سکته یا فلج شدن از دست داده‌اند، متحول کند. ویدیوی منتشرشده از این فناوری نشان می‌دهد که یک سوژه انسانی در حال فکر کردن به جمله‌ای است که روی صفحه نمایش نشان داده می‌شود. سپس مدل هوش مصنوعی، آن را رمزگشایی می‌کند...
    به گزارش خبرگزاری مهر به نقل از نیواطلس، به نظر می رسد امیدی برای افراد دچار سکته و بیمارانی که نمی توانند با ابزارهای معمول با دیگران ارتباط برقرار کنند، به وجود آمده است. این امید در حقیقت توسعه سیستم BrainGPT جدید و آزمایشی است که می تواند افکار کاربران را بخواند و به متن قابل خوانش تبدیل کند. افراد فلج که از «حالت قفل شده» (Lock-In State) رنج می برند نه تنها قادر به تکلم نیستند، بلکه نمی توانند از حرکات دست یا سر برای برقراری ارتباط استفاده کنند. برخی از آنها می توانند چشمان خود را حرکت دهند بنابراین می توانند از سیستم های ارتباطی ردیابی چشم استفاده کنند، اما برخی دیگر حتی این توانایی را هم ندارند....
    شرکت OpenAI از نسخه سوم ابزار هوش مصنوعی تبدیل متن به تصویر DALL-E خود رونمایی کرد. هوش مصنوعی DALL-E می‌تواند پیام‌های متنی کاربران را به تصویر تبدیل کند، اما عملکرد دومین نسخه آن با مشکلاتی همراه بود و برخی عبارات خاص را نادیده می‌گرفت. با این حال اکنون محققان OpenAI اعلام کرده‌اند که DALL-E ۳ متن کاربران را بسیار بهتر درک می‌کند.یکی از ویژگی‌های جدید DALL-E ۳ ادغام با ChatGPT است. با وجود این ویژگی، دیگر نیازی نیست تا توضیحات دقیقی برای DALL-E ارائه کنید، بلکه می‌توانید از ChatGPT بخواهید تا درخواست شما را به آن ارائه کند و با توجه به اینکه DALL-E با جملات طولانی‌تر عملکرد بهتری از خود ارائه می‌کند، طبیعتاً این موضوع باعث می‌شود تا...
    تبدیل متن به تصویر یکی از کاربردهای هوش مصنوعی در تولید محتواست. این فناوری به ما امکان می‌دهد تا تصاویری را از متن ایجاد کنیم که می‌تواند برای اهداف مختلفی مانند آموزش، سرگرمی و بازاریابی مورد استفاده قرار گیرد. در این مقاله، ۱۰ راهکار برای تبدیل متن به تصویر با هوش مصنوعی را بررسی خواهیم کرد. این راهکارها از ابزارهای ساده آنلاین گرفته تا کتابخانه‌های Python و مدل‌های آموزش دیده شخصی را شامل می‌شوند.  با پیشرفت هوش مصنوعی، انتظار می‌رود که شاهد کاربردهای جدید و هیجان انگیزتری از این فناوری در زمینه تبدیل متن به تصویر باشیم. استفاده از ابزارهای برخط  با استفاده از  ابزار آنلاین   می‌توان برای تبدیل متن به تصویر با هوش مصنوعی استفاده کرد. معمولا کار با...
    به گزارش خبرگزاری صدا و سیما، به نقل از مرکز ارتباطات و اطلاع‌رسانی معاونت علمی، فناوری و اقتصاد دانش بنیان ریاست جمهوری، به گفته محققان، این طرح در حوزه هوش مصنوعی است و طراحی و آزمون هوش مصنوعی از زمینه‌های مطالعاتی به شمار می‌رود. این محصول دانش‌بنیان، یک سکوی جمع‌سپاری مسائل است. و این سامانه با در اختیار داشتن کاربران فعال در سراسر کشور، خدمات جمع‌آوری، تگ‌گذاری، جداسازی، اصلاح، انتخاب بر انواع داده‌های متنی، صوتی و تصویری را در تمامی قالب‌ها ارائه می‌کند. به گفته این محقق، جمع‌سپاری به معنای تقسیم یک کار بین تعداد زیادی از افراد به گونه‌ای که هر فرد بخش کوچکی از آن را انجام دهد. در حال حاضر حدود ۷۰ هزار کاربر در این سکو...
    به گزارش همشهری آنلاین، رضا رضازادگان مدیرعامل این شرکت می‌گوید: «این نرم‌افزار با استفاده از هوش مصنوعی می‌تواند نوشته‌های فارسی را به‌عنوان یک زبان طبیعی، به گفتار تبدیل کند. این نرم‌افزار با توجه به کاربردهای مختلف آن، توانسته است مورد استفاده مجموعه‌های مختلف آموزشی، دوبله و متن خوانی، تولید کنندگان کتاب صوتی و شرکت های دیگر قرار گیرد.» او ادامه داد: «این نرم‌افزار همچنین می‌تواند به افرادی که توانایی خوانش متون را ندارند، کمک کند؛ به گونه‌ای که حتی نابینان هم می‌توانند با استفاده از این نرم افزار، متن را به گفتار تبدیل کرده و از آن استفاده کنند.» رضازادگان گفت: «با توجه به عدم حرکت‌گذاری کلمات در زبان فارسی از یکسو و وجود کسره اضافه از سوی دیگر، پردازش...
    به گزارش گروه علم و پیشرفت خبرگزاری فارس، لومن5 نرم افزاری است که بهترین استفاده را برای ایجاد ویدئوهای جذاب دارد. این نرم افزار با استفاده از هوش مصنوعی به همراه امکانات و توانایی های نرم افزار ویرایش ویدئو قدرت گرفته است. می توانید با مراجعه به وب سایت لومن5 در آدرس www.lumen5.com  ثبت نام کنید. هنگامی که در صفحه اصلی هستید، روی دکمه Sign up در گوشه سمت راست بالای صفحه یا Sign up free در وسط کلیک کنید.   از شما خواسته می شود آدرس ایمیل، رمز عبور خود را وارد کنید. لومن5سه طرح قیمت گذاری مختلف ارائه می دهد: رایگان، پریمیوم و بیزینس.  طرح رایگان ویژگی‌های اساسی مانند دسترسی محدود به کتابخانه رسانه، واترمارک روی...
    با گسترش سیستم Chat GPT در دنیا برنامه‌های بسیاری مبتنی بر این سیستم طراحی شده است که برخی از آن‌ها کاملاً رایگان، برخی اشتراکی و تعدادی از آن‌ها کاملاً پولی هستند. سیستم اصلی Chat GPT که توسط شرکت OpenAI طراحی شده است در وب‌سایت این شرکت برای تمام سیستم‌عامل‌ها در دسترس است. به گزارش خبرنگار ایمنا، در دهه گذشته، پیشرفت‌های چشمگیر در حوزه هوش‌مصنوعی باعث شده تا این تکنولوژی به عنوان یکی از عوامل کلیدی در توسعه برنامه‌ها و سیستم‌های موبایلی شناخته شود. گوشی‌های هوشمند اندروید و آیفون به تبدیل رویای هوش مصنوعی به واقعیت کمک کرده‌اند و به طور فزاینده‌ای از این تکنولوژی برای ارتقای تجربه کاربری، بهینه‌سازی فرآیندهای مختلف و ایجاد امکانات نوآورانه استفاده می‌کنند. هوش مصنوعی چیست؟...
    مدل هوش مصنوعی جدید CM۳Leon متا مدعی است که در مقایسه با نمونه‌های رقیب ازجمله مدل DALL-E ۲، بهترین عملکرد را دارد. به گزارش دیجیاتو، طی دو سال اخیر مدل‌های هوش مصنوعی تولید تصویر رواج بالایی پیدا کرده‌اند و موانع فنی استفاده از آن‌ها تقریباً برطرف شده است. البته این بدان معنا نیست که عملکرد این مدل‌ها پایدار شده و به سطح مناسبی رسیده است؛ ولی متا ادعا می‌کند که با مدل جدید CM۳Leon دستاورد مهمی داشته و بهترین نمونه را در این حوزه ساخته است. متا امروز از مدل هوش مصنوعی جدیدی به نام CM۳Leon (یا همان Chameleon یا «آفتاب‌پرست») رونمایی کرده و می‌گوید این سیستم می‌تواند در تبدیل متن به تصویر بهترین عملکرد را به نمایش بگذارد. این...
    هوش مصنوعی ابزاری را ارائه کرده است که نقاشی ها و طرح‌های اولیه را در چند ثانیه به اثر هنری تبدیل می‌کند. بسیاری از ما آرزوی هنرمند شدن را در مقطعی از زندگی خود داشته‌ایم و اکنون این رویا می‌تواند به لطف ابزار‌های هوش مصنوعی که طرح‌های خام را به آثار هنری زیبا تبدیل می‌کند، ممکن شود.در اوایل این هفته، کوالکام از ControlNet رونمایی کرد؛ ابزاری که تصاویر و متن را تنها در ۱۲ ثانیه به آثار هنری تبدیل می‌کند.برخلاف بسیاری از قالب‌های دیگر از این نوع مانند Adobe AI Firef برنامه جدید ControlNet برای کارکرد، نیازی به اینترنت ندارد و به زودی می‌تواند به یک برنامه اصلی تلفن همراه تبدیل شود.یکی از سخنگویان کوالکام گفت: هوش مصنوعی مولد...
    ایتنا - متا با اشاره به «خطرات احتمالی سوء استفاده» با وجود «موارد استفاده بسیار هیجان‌انگیزی که برای مدل‌های گفتار مولد» وجود دارد اعلام کرد که نه اپ Voicebox و نه کد منبع آن در حال حاضر برای استفاده عموم منتشر نمی‌شود. یک گام دیگر به سمت تحقق دنیای سلبریتی‌های بدون‌مرگ برداشته شد: متا از مدل مولد متن به گفتار خود موسوم به Voicebox، که وعده داده است همان کاری را که ChatGPT و Dall-E برای تولید متن و تصویر انجام دادند برای کلام گفتاری انجام دهد، رونمایی کرد.   به گزارش ایتنا و به نقل از انگجت، اساساً این ابزار یک تولیدکننده متن به خروجی است، درست مانند GPT یا Dall-E، فقط به جای ایجاد متن یا تصاویر زیبا،...
    شرکت متا اولین مدل هوش مصنوعی خود را در زمینه تبدیل متن به صدا معرفی می‌کند.   شرکت متا اولین پیشنهادات خود در زمینه هوش مصنوعی را از زمان رشد صنعت تولید هوش مصنوعی در اواخر سال ۲۰۲۲ ارائه کرد. انتظار می‌رود برنامه تبدیل متن به صدای این برند، به نام Voicebox، معادل صوتی ربات ChatGPT باشد که پیام‌های متنی را پردازش می‌کند. Voicebox به نوبه خود قادر به دریافت پیام‌های متنی و تولیدکلیپ‌های صوتی خواهد بود.این برنامه با بیش از ۵۰ هزار ساعت صوت بدون فیلتر، از جمله گفتار و متون حوزه عمومی به زبان‌های انگلیسی، فرانسوی، اسپانیایی، آلمانی، لهستانی و پرتغالی آموزش داده شده است.Voicebox مایل به ایجاد نتایج در گفتار مکالمه در انواع زبان‌های موجود است. متا...
    به گزارش خبرنگار خبرگزاری علم و فناوری آنا، شرکت متا از «ویس باکس» (Voicebox) مدل تبدیل متن به گفتار خود رونمایی کرد. این شرکت وعده می‌دهد برای تبدیل متن به گفتار همان کاری را انجام می‌دهد که «چت جی پی تی» (ChatGPT) و «دال ای» (Dall - E) برای تولید متن و تصویر انجام دادند. مدل هوش مصنوعی «ویس باکس» مانند «جی پی تی» یا «دال ای» یک مولد متن به خروجی است، فقط به جای ایجاد متن یا تصاویر زیبا، کلیپ‌های صوتی را پخش می‌کند. متا این سیستم را این گونه تعریف می‌کند: «یک مدل هماهنگ‌ساز جریان به‌صورت غیرخودکاهنده برای تکمیل صدا براساس زمینه و متن» که این مدل روی بیش از 50 هزار ساعت صدای فیتلرنشده تعلیم یافته...
    به گزارش خبرنگار خبرگزاری علم و فناوری آنا، شرکت متا از «ویس باکس» (Voicebox) مدل تبدیل متن به گفتار خود رونمایی کرد. این شرکت وعده می‌دهد برای تبدیل متن به گفتار همان کاری را انجام می‌دهد که «چت جی پی تی» (ChatGPT) و «دال ای» (Dall - E) برای تولید متن و تصویر انجام دادند. مدل هوش مصنوعی «ویس باکس» مانند «جی پی تی» یا «دال ای» یک مولد متن به خروجی است، فقط به جای ایجاد متن یا تصاویر زیبا، کلیپ‌های صوتی را پخش می‌کند. متا این سیستم را این گونه تعریف می‌کند: «یک مدل هماهنگ‌ساز جریان به‌صورت غیرخودکاهنده برای تکمیل صدا براساس زمینه و متن» که این مدل روی بیش از 50 هزار ساعت صدای فیتلرنشده تعلیم یافته...
    امین رحمانی، مدیر و بنیان گذار شرکت دانش ‌بنیان «ویراویراست» در گفتگو با خبرنگار ارتباطات و فناوری اطلاعات خبرگزاری علم و فناوری آنا، گفت: ویراویراست شرکتی فعال در حوزه هوش مصنوعی است که با طراحی برنامه‌های زبان‌محور، امکانات خوبی برای کاستی‌های فناورانه در زبان فارسی فراهم می‌کند. پردازشگر‌های زبانی، طی سال‌ها آزمون و خطا درک جامعی از عملکرد هوش مصنوعی به ما داده‌اند. این درک عمیق به ما این توانایی را می‌دهد که برای سازمان‌ها راهکار‌هایی مبتنی بر هوش مصنوعی طراحی کنیم تا در زمان و هزینه صرفه‌جویی کنند.وی درباره محصولات ارائه شده توسط این شرکت بیان کرد: ما ۴ محصول مبتنی بر هوش مصنوعی طراحی کرده‌ایم. «ویرا تایپ» تایپ گفتاری هم‌زمان است، همان‌طور که  صحبت می‌کنید برنامه متن شما...
    امین رحمانی، مدیر و بنیان گذار شرکت دانش ‌بنیان «ویراویراست» در گفتگو با خبرنگار ارتباطات و فناوری اطلاعات خبرگزاری علم و فناوری آنا، گفت: ویراویراست شرکتی فعال در حوزه هوش مصنوعی است که با طراحی برنامه‌های زبان‌محور، امکانات خوبی برای کاستی‌های فناورانه در زبان فارسی فراهم می‌کند. پردازشگر‌های زبانی، طی سال‌ها آزمون و خطا درک جامعی از عملکرد هوش مصنوعی به ما داده‌اند. این درک عمیق به ما این توانایی را می‌دهد که برای سازمان‌ها راهکار‌هایی مبتنی بر هوش مصنوعی طراحی کنیم تا در زمان و هزینه صرفه‌جویی کنند.وی درباره محصولات ارائه شده توسط این شرکت بیان کرد: ما ۴ محصول مبتنی بر هوش مصنوعی طراحی کرده‌ایم. «ویرا تایپ» تایپ گفتاری هم‌زمان است، همان‌طور که  صحبت می‌کنید برنامه متن شما...
    امین رحمانی، مدیر و بنیان گذار شرکت دانش ‌بنیان «ویراویراست» در گفتگو با خبرنگار ارتباطات و فناوری اطلاعات خبرگزاری علم و فناوری آنا، گفت: ویراویراست شرکتی فعال در حوزه هوش مصنوعی است که با طراحی برنامه‌های زبان‌محور، امکانات خوبی برای کاستی‌های فناورانه در زبان فارسی فراهم می‌کند. پردازشگر‌های زبانی، طی سال‌ها آزمون و خطا درک جامعی از عملکرد هوش مصنوعی به ما داده‌اند. این درک عمیق به ما این توانایی را می‌دهد که برای سازمان‌ها راهکار‌هایی مبتنی بر هوش مصنوعی طراحی کنیم تا در زمان و هزینه صرفه‌جویی کنند.وی درباره محصولات ارائه شده توسط این شرکت بیان کرد: ما ۴ محصول مبتنی بر هوش مصنوعی طراحی کرده‌ایم. «ویرا تایپ» تایپ گفتاری هم‌زمان است، همان‌طور که  صحبت می‌کنید برنامه متن شما...
    به گزارش خبرگزاری صداوسیما، برنامه «۶۰ دقیقه» شبکه سی بی اس آمریکا اخیراً پرونده‌ای درباره ابزار‌های هوش مصنوعی گوگل داشته و در این برنامه برای اولین‌بار فناوری تبدیل متن به ویدئوی این شرکت را نشان داده است. این نرم‌افزار هنوز عمومی نشده است و استفاده از آن محدودیت‌هایی دارد. گوگل در تکاپو است تا هرچه سریع‌تر در زمینه هوش مصنوعی به رقبای خود از جمله مایکروسافت برسد. از میان پروژه‌هایی که این شرکت مشغول کار روی آن‌هاست، ابزار تبدیل متن به ویدئوست که بسیار جذاب به‌نظر می‌رسد و تا پیش از پخش برنامه «۶۰ دقیقه» صحبتی از آن به میان نیامده بود.   نرم‌افزار هوش مصنوعی تولید ویدئو در گوگل فعلاً با نام Phenaki شناخته می‌شود. این نام احتمالاً با...
     به گزارش خبرگزاری صدا و سیما، برنامه «۶۰ دقیقه» شبکه CBS آمریکا اخیراً پرونده‌ای درباره ابزار‌های هوش مصنوعی گوگل داشته و در این برنامه برای نخستین‌بار فناوری تبدیل متن به ویدیوی این شرکت را نشان داده است. این نرم‌افزار هنوز عمومی نشده است و استفاده از آن محدودیت‌هایی دارد.   گوگل در تلاش است تا هرچه سریع‌تر در زمینه هوش مصنوعی به رقبای خود ازجمله مایکروسافت برسد. از میان طرحهایی که این شرکت مشغول کار روی آن‌هاست، ابزار تبدیل متن به ویدیو بسیار جذاب به‌نظر می‌رسد و تا پیش از پخش برنامه «۶۰ دقیقه» صحبتی از آن به میان نیامده بود.   نرم‌افزار هوش مصنوعی تولید ویدیو در گوگل فعلاً با نام Phenaki شناخته می‌شود. این نام احتمالاً با الهام...
    برنامه «۶۰ دقیقه» شبکه CBS آمریکا اخیراً پرونده‌ای درباره ابزار‌های هوش مصنوعی گوگل داشته و در این برنامه برای اولین‌ بار فناوری تبدیل متن به ویدیوی این شرکت را نشان داده است. این نرم‌افزار هنوز عمومی نشده است و استفاده از آن محدودیت‌هایی دارد. گوگل در تکاپو است تا هرچه سریع‌تر در زمینه هوش مصنوعی به رقبای خود ازجمله مایکروسافت برسد. از میان پروژه‌هایی که این شرکت مشغول کار روی آن‌هاست، ابزار تبدیل متن به ویدیو بسیار جذاب به‌نظر می‌رسد و تا پیش از پخش برنامه «۶۰ دقیقه» صحبتی از آن به میان نیامده بود. نرم‌افزار هوش مصنوعی تولید ویدیو در گوگل فعلاً با نام Phenaki شناخته می‌شود. این نام احتمالاً با الهام از فَریب‌بین یا فناکیستوسکوپ (Phenakistoscope) انتخاب...
    مایکروسافت یکی از سرمایه گذاران اصلی «اوپن آ. آی» است و میلیارد‌ها دلار در این شرکت هزینه می‌کند. آندرئاس براون مدیر ارشد فناوری شاخه مایکروسافت در آلمان همچنین اعلام کرد در روز‌های آینده یک نسخه قدرتمندتر هوش مصنوعی اضافه می‌شود که پایانی بر گمانه زنی‌ها خواهد بود. او در این باره گفت: ما GPT-۴ را ارائه می‌کنیم که در آن چند مدل چندگانه قابلیت‌های کاملا متفاوتی مانند ویدئو را ارائه می‌کنند. در این میان گمانه زنی و هیجان درباره مدل آتی هوش مصنوعی مولد اوپن آ. آی بیشتر شده، اما سم آلتمن مدیر ارشد اجرایی این شرکت در مصاحبه‌ای گفت: گویی که مردم می‌خواهند ناامید شوند و احتمالا نیز می‌شوند. میرا موراتی مدیر ارشد فناوری «اوپن آ. آی» در...
    ایتنا - ​​​​​​​به گفته آندرئاس براون مدیر ارشد فناوری شاخه مایکروسافت در آلمان در نسخه جدید هوش مصنوعی جی پی تی-۴ متعلق به «اوپن آ. آی» به کاربران اجازه می دهد متن را به ویدئو تبدیل کنند. مایکروسافت یکی از سرمایه گذاران اصلی«اوپن آ. آی» است و میلیاردها دلار در این شرکت سرازیر می کند. براون همچنین اعلام کرد در روزهای آینده یک نسخه قدرتمندتر هوش مصنوعی اضافه می شود که پایانی بر گمانه زنی ها خواهد بود. او در این باره گفت: ما GPT-4 را ارائه می کنیم که در آن چند مدل چندگانه قابلیت های کاملا متفاوتی مانند ویدئو را ارائه می کنند. به گزارش ایتنا و به نقل از مهر، در این میان...
    به گفته آندرئاس براون مدیر ارشد فناوری شاخه مایکروسافت در آلمان در نسخه جدید هوش مصنوعی جی پی تی-۴ متعلق به «اوپن آ. آی» به کاربران اجازه می دهد متن را به ویدئو تبدیل کنند. مایکروسافت یکی از سرمایه گذاران اصلی «اوپن آ. آی» است و میلیارد‌ها دلار در این شرکت سرازیر می‌کند. براون همچنین اعلام کرد: در روز‌های آینده یک نسخه قدرتمندتر هوش مصنوعی اضافه می‌شود که پایانی بر گمانه زنی‌ها خواهد بود. او در این باره گفت: ما GPT-۴ را ارائه می‌کنیم که در آن چند مدل چندگانه قابلیت‌های کاملا متفاوتی مانند ویدئو را ارائه می‌کنند. در این میان گمانه زنی و هیجان درباره مدل آتی هوش مصنوعی مولد اوپن آ. آی بیشتر شده، اما سم آلتمن مدیر ارشد اجرایی...
    به گزارش خبرگزاری مهر به نقل از بیزینس اینسایدر، مایکروسافت یکی از سرمایه گذاران اصلی«اوپن آ. آی» است و میلیاردها دلار در این شرکت سرازیر می کند. براون همچنین اعلام کرد در روزهای آینده یک نسخه قدرتمندتر هوش مصنوعی اضافه می شود که پایانی بر گمانه زنی ها خواهد بود. او در این باره گفت: ما GPT-4 را ارائه می کنیم که در آن چند مدل چندگانه قابلیت های کاملا متفاوتی مانند ویدئو را ارائه می کنند. در این میان گمانه زنی و هیجان درباره مدل آتی هوش مصنوعی مولد اوپن آ. آی بیشتر شده اما سم آلتمن مدیر ارشد اجرایی این شرکت در مصاحبه ای گفت: گویی که مردم می خواهند ناامید شوند و احتمالا نیز می شوند. میرا...
    به گزارش خبرگزاری صدا و سیما: OpenAI که به‌تازگی دسترسی به ChatGPT را برای کسب‌و‌کار‌ها و توسعه‌دهندگان امکان‌پذیر کرده، گفته است که API مشابهی برای ابزار Whisper نیز می‌سازد. Whisper سرویسی بر پایه‌ی هوش مصنوعی است که گفتار را به متن تبدیل می‌کند. OpenAI همچنین تغییراتی در قوانین استفاده از سرویس‌هایش برای توسعه‌دهندگان اعمال کرده است.OpenAI می‌گوید API جدید ChatGPT صرفاً محدود به اضافه کردن چت‌بات به اپلیکیشن‌ها نیست و قابلیت‌های دیگری نیز دارد. ظاهرا چند شرکت ازجمله اسنپ (توسعه‌دهنده‌ی اسنپ‌چت) از همین حالا سراغ تزریق ChatGPT به سرویس‌های خود رفته‌اند.در بخشی از بیانیه‌ی OpenAI آمده که مدل هوش مصنوعی جدید GPT-۳.۵-Turbo «بهترین مدل برای بسیاری از کاربرد‌های غیر چت است.»آن‌طور که ورج می‌نویسد، مدل موردبحث با آنچه مایکروسافت در...
     به گزارش گروه بازار خبرگزاری آنا به نقل از روابط عمومی آیگپ، پیام‌رسان آیگپ در مسیر توسعه و همگام سازی با نمونه های موفق کاربردی و پرطرفدار مشابه در دنیا، پس از برداشتن اولین گام در مسیر هوشمند شدن که همراه با ارائه سومین نسل از این پیام‌رسان اتفاق افتاد، سرویس‌های کاربردی و پرطرفدار TTS  و ASR را بروزرسانی کرد. در این بروزرسانی، اتفاقات متفاوتی رخ داده که آیگپ را متمایز از سایر پیام‌رسان‌ها در مسیر هوشمند شدن قرار داده است. سرویس TTS (تکنولوژی تبدیل متن به گفتار) سرویس TTS (تکنولوژی تبدیل متن به گفتار) در نسخه بروزرسانی شده با قابلیت‌های پایه‌ زیر ارائه شده است: • قابلیت خوانش متون فارسی • قابلیت اعراب‌گذاری خودکار متون • امکان تغییر سرعت...
    به گزارش گروه علم و پیشرفت خبرگزاری فارس به نقل از ورج، محققان گوگل سیستم هوش مصنوعی جدیدی را ساختند که می‌تواند قطعات موسیقی چند دقیقه‌ای را از پیام‌های متنی تولید و حتی ملودی سوت یا زمزمه‌ را به سازهای دیگر تبدیل کند. گوگل قطعه‌های 30 ثانیه‌ای از آنچه شبیه آهنگ‌های واقعی به نظر می‌رسد منتشر کرده این قطعات از توضیحات طولانی ایجاد شده‌اند. این ویژگی احتمالا برای همه در دسترس نباشد. این مدل MusicLM نام دارد و حتی می‌تواند صدای انسان را شبیه‌سازی کند. مطمئناً این مدل اولین سیستم هوش مصنوعی مولد برای آهنگ نیست. تلاش‌های دیگری نیز از جمله Riffusion ، Dance Diffusion، AudioML گوگل و Jukebox OpenAI انجام شده است. اما هیچ‌کدام به دلیل محدودیت‌های فنی و...
    شرکت متا ابزاری جدید در زمینه هوش مصنوعی ابداع کرده است قادر است بر اساس ورودی‌های متن، ویدئو تولید کند. به گزارش خبرنگار گروه علمی و فناوری خبرگزاری برنا؛  ابزار هوش مصنوعی شرکت متا که «یک ویدئو بساز» نام دارد، می‌تواند ویدئو‌های کوتاهی را از متن تولید کند. «یک ویدئو بساز» هنوز برای عموم در دسترس نیست. متا این فناوری را به طور رسمی در ماه نوامبر راه‌اندازی می‌کند؛ اما به نظر می‌رسد درست مانند هوش‌های مصنوعی که تصویر تولید می‌کنند، کار کند: شما یک پیام متنی را اضافه می‌کنید، هر اندازه که دوست دارید آنچه را می‌خواهید توصیف می‌کنید و بعد منتظر ویدئو می‌مانید. فناوری موجود در پس «یک ویدئو بساز» مبتنی‌بر کار‌هایی است که هم‌اکنون در تبدیل متن...
    خبرگزاری آریا-شرکت متا ابزاری جدید در زمینه هوش مصنوعی ابداع کرده است قادر است بر اساس ورودی‌های متن، ویدئو تولید کند.به گزارش خبرگزاری آریا به نقل از وبگاه علمی زدام‌ای ساینس، ابزار هوش مصنوعی شرکت متا که «یک ویدئو بساز» نام دارد، می‌تواند ویدئو‌های کوتاهی را از متن تولید کند که دستاورد چشمگیری است.«یک ویدئو بساز» هنوز برای عموم در دسترس نیست. قرار است متا آن را به طور رسمی در ماه نوامبر راه‌اندازی می‌کند؛ اما به نظر می‌رسد درست مانند هوش‌های مصنوعی که تصویر تولید می‌کنند، کار کند: شما یک پیام متنی را اضافه می‌کنید، هر اندازه که دوست دارید آنچه را می‌خواهید توصیف می‌کنید و بعد منتظر ویدئو می‌مانید.فناوری موجود در پس «یک ویدئو بساز» مبتنی‌بر کار‌هایی...
    به گزارش گروه علم و آموزش ایرنا از وبگاه زِداِم‌ای سایِنس (ZME Science)، در هفته‌های اخیر، هوش‌های مصنوعی تولیدکننده تصویر شکوفا شده‌ و توانایی‌شان فراتر از آن شده است که چند سال پیش انتظارش را داشتیم. اکنون، الگوریتم‌ها آماده هستند تا همه‌ چیز را به مرحله بعدی ببرند و شروع به تولید ویدئو کنند. تصور کنید «یک سگ با لباس اَبَرقهرمان و شنل قرمز در آسمان پرواز می‌کند.» این تمام ورودی متنی است که برای تولید کلیپ بالا نیاز دارید. هوش مصنوعی شرکت متا که «یک ویدئو بساز» نام دارد، می‌تواند ویدئوهای کوتاهی را از متن تولید کند که دستاورد چشمگیری است. «یک ویدئو بساز» هنوز برای عموم در دسترس نیست. قرار است متا آن را به طور رسمی در...
    فرارو- متا به تازگی از یک سیستم هوش مصنوعی جدید به نام Make-A-Video رونمایی کرده است. این سیستم به کاربران این امکان را می‌دهد تا با وارد کردن توضیحات متنی در خصوص یک صحنه، کلیپ‌های ویدئویی کوتاه تولید کنند. به گزارش فرارو به نقل از rahnamato، متا با ارائه قابلیت‌های تولید متن به ویدئو در این سیستم، توانست این فناوری را یک قدم جلوتر ببرد. با این حال، این شرکت هنوز این قابلیت جدید را به صورت عمومی منتشر نکرده است. ویدئو‌های ایجاد شده توسط این سیستم، پنج ثانیه یا کوتاهتر هستند و هیچ گونه صدایی ندارند. اما متا ادعا می‌کند که طیف گسترده‌ای از دستورات توسط این هوش مصنوعی پشتیبانی می‌شود. متا در یک پست وبلاگی اعلام کرده که...
    این ترفند بسیار هیجان‌انگیز است و به کاربران امکان می‌دهد تصاویر و آثار هنری را به کمک محتوای تولید شده توسط هوش مصنوعی گسترش دهند. شرکت (Open AI)، یک شرکت توسعه دهنده مولد متن به تصویر (DALL- E ۲) به تازگی ویژگی جدیدی را برای این برنامه به نام "خارج سازی" ایجاد کرده است. این قابلیت جدید، به کاربران امکان می‌دهد تصاویر و آثار هنری را به کمک محتوای تولید شده توسط هوش مصنوعی گسترش دهند. این ترفند بسیار هیجان انگیز است و قابلیت‌های ابزاری را به شدت گسترش می‌دهد. این ابزار یکی از محبوب‌ترین مولد‌های تبدیل متن به تصویر است که در حال حاضر موجود است. با بیش از یک میلیون کاربر جای تعجب نیست که محتوای ایجاد شده...
    فرارو-پلتفرم ویدئویی تیک تاک اخیرا افکت جدیدی به نام «AI greenscreen» را به اپلیکیشن خود اضافه کرده است که امکان تبدیل پیام متنی کاربران را به تصویر فراهم می‌کند. کاربران سپس می‌توانند از این تصویر به عنوان پس زمینه تصاویر استفاده کنند. به گزارش فرارو، خروجی این سیستم درمقایسه با مدل‌های پیشرفته تبدیل متن به تصویر مانند Imagen گوگل، هوش مصنوعی DALL-E2 شرکت OpenAI یا نرم افزار Midjourney بسیار ابتدایی به نظر می‌رسد. این افکت قادر است تصاویر نسبتاً انتزاعی و چرخشی را ایجاد کند. نرم افزار‌های پیشرفته‌تر می‌توانند هم تصاویر فوتورئالیستی و هم تصاویر پیچیده و منسجمی که به نظر می‌رسد توسط انسان طراحی یا نقاشی شده‌اند را تولید کنند. اگرچه ممکن است وجود این محدودیت‌ها توسط تیک...
    عصر ایران - طی چند سال اخیر شاهد تغییری اساسی در روند تولید تصاویر بوده ایم. در همین راستا، ورود و رشد یادگیری ماشینی و هوش مصنوعی پرسش هایی را در مورد نحوه تکامل و توسعه فرایندهای خلاق از طریق فناوری ایجاد کرده اند. سامانه هایی مانند دال-ئی (DALL-E)، دال-ئی 2 (DALL-E 2) و میدجرنی (Midjourney) برنامه های هوش مصنوعی هستند که برای ایجاد تصاویر بر مبنای توضیحات متنی با استفاده از مجموعه داده شکل گرفته اند. با استفاده از این سامانه ها طیف متنوعی از قابلیت ها مانند ایجاد جنبه های انسانی برای حیوانات و اشیا، ترکیب مفاهیم نامرتبط به روش های قابل قبول، و اعمال دگرگونی های مختلف در تصاویر در دسترس قرار گرفته اند. دال-ئی و...
    گوگل از سیستم هوش مصنوعی جدیدی پرده برداشته که می‌تواند با دریافت متن تصویر خلق کند. این سیستم در واقع به کاربر اجازه می‌دهد تا با نوشتن یک متن توصیفی از طریق هوش مصنوعی معادل تصویری آن را ببیند. این شرکت مدعی است که مدل Imagen دارای سطح بی‌بدیلی از واقع‌گرایی و درک عمیقی از زبان‌هاست. مدل هوش مصنوعی گوگل به راحتی توسط همه کاربران قابل استفاده است. برای مثال اگر بنویسید «تصویر یک گربه پرشین که کلاه گاوچرانی به سر گذاشته، پیراهن قرمز پوشیده و در ساحل گیتار می‌زند» تصویر زیر به دست می‌آید. گوگل می‌گوید در مقایسه‌ای که بین مدل خود و سایر مدل‌های مشابه داشته، فهمیده که کاربران دقت و صحت تصاویر را در این مدل بیشتر...
    گوگل یک هوش مصنوعی متن به تصویر جدید دارد که به گفته این شرکت رقبا را شکست می‌دهد.  این برنامه که Imagen نام دارد، متنی را دریافت می‌کند و توصیف آن را به صورت عکس خروجی می‌دهد. به گزارش cnet، قابلیت Imagen از دیگر مولد‌های تبدیل متن به تصویر مانند مدل‌های DALL-E، VQ-GAN+CLIP و Latent Diffusion پیروی می‌کند. هنگامی که از گوگل خواسته شد تصاویر ایجاد شده توسط Imagen و سایر تولیدکنندگان متن به تصویر را مقایسه کند، مردم دریافتند که مدل گوگل از رقبای خود در دقت و وفاداری به متن، تصویر بهتری ایجاد می‌کند. گوگل چندین نمونه از پیام‌های متنی و تصاویر حاصل از هوش مصنوعی را در وب سایت Imagen خود به اشتراک گذاشت. مدل‌های یادگیری متن...
    ایتنا- کمپانی مایکروسافت پس از مدت‌ها انتظار هوش مصنوعی تبدیل متن به گفتار خود را به صورت محدود در اختیار برخی از کاربران مشتاق قرار داده است. کمپانی مایکروسافت پس از مدت‌ها انتظار هوش مصنوعی تبدیل متن به گفتار خود را به صورت محدود در اختیار برخی از کاربران مشتاق قرار داده است.   به گزارش ایتنا و به نقل از  Engadget، مایکروسافت به تازگی مجوز دسترسی اولیه به هوش مصنوعی تبدیل متن به گفتار ویژه‌ای به نام Custom Neural Voice را صادر کرده است. توسعه دهندگان با استفاده از این هوش مصنوعی‌می توانند صوت‌های مصنوعی شخصی سازی شده‌ای ایجاد کنند.   فناوری یاد شده بخشی از سرویس هوش مصنوعی آژور به نام Speech است. کمپانی‌می توانند از این فناوری برای...
    محققان هوش مصنوعی در تلاش اند تا با استفاده از این فناوری بتوانند افکار انسان را خوانده و آن را به متن تبدیل کنند. به گزارش خبرنگار حوزه علم، فناوری و دانش بنیان گروه دانشگاه خبرگزاری آنا،دورانی را تصور کنید که بتوانید افکار شخص را از طریق تله پاتی بخوانید و از برنامه‌های خوب یا بد آن‌ها پرده بردارید، یا فنی که افکار یک شخص ساکت (کسی که حرف نمی‌زند و یا اختلال گفتاری دارد) یا حیوانات خانگی شمارا بخواند و به شما در برقراری ارتباط بهتر کمک کند. بله، تیمی در دانشگاه کالیفرنیا، این آزمایش را انجام دادند و ما را یک‌قدم به این رؤیا نزدیک‌تر کردند. جوزف ماکین، یک از اعضای تیم تحقیق گفت: ما هنوز به...
    به گزارش خبرنگار حوزه دریچه فناوری گروه فضای مجازی باشگاه خبرنگاران جوان، شرکت بزرگ مایکروسافت با ارتقا سیستم هوش مصنوعی خود، آن را به گونه‌ای توسعه داده است که به خوبی با کاربر هماهنگ شد و پس از مدت کوتاهی تمرین، قادر به ارائه یک سخنرانی کامل و واقع‌گرایانه به کاربر خود است. بیشتر بخوانید: لذت تماشای دنیایی متفاوت با بازی Earth Minecraft +فیلم تبدیل متن به گفتار روشی هوشمندانه در ارتقا کیفیت هرچه بیشتر سخنرانی‌ها یا رائه کنفرانس‌های علمی است ولی در این مسیر هنوز هم مشکلاتی وجود دارد. یکی از بارزترین این مشکلات زمان زیادی است که نرم‌افزارهای تبدیل متن به گفتار برای هماهنگی کامل با کاربر و ارائه فایل صوتی با صدای طبیعی، نیاز دارند. حال مهندسان...
    ایتنا -محققان چینی و مایکروسافت یک سیستم هوش مصنوعی برای تبدیل متن به صوت ابداع کرده‌اند که با کمک ۲۰۰ نمونه یک فایل صوتی بسیار طبیعی تولید کند. فناوری تبدیل متن به صوت هر روز هوشمندتر می‌شود اما هنوز مشکلی در مسیر پیشرفت آن وجود دارد. این فناوری هنوز هم نیازمند مدت زمان آموزش و منابع زیادی است تا بتواند بازدهی طبیعی‌تر ارائه کند. در همین راستا به نظر می‌رسد محققان چینی و مایکروسافت راه حلی ایده آل برای این امر یافته اند. آنها یک سیستم هوش مصنوعی تبدیل متن به صوت ابداع کرده‌اند که می‌تواند فقط با کمک ۲۰۰ نمونه صوتی (معادل ۲۰ دقیقه)، فایل صوتی طبیعی تولید کند. این سیستم به شبکه‌های عصبی عمیقی تکیه دارد که عملکرد نورون‌های...
    فناوری تبدیل متن به صوت هر روز هوشمندتر می‌شود اما هنوز مشکلی در مسیر پیشرفت آن وجود دارد. این فناوری هنوز هم نیازمند مدت زمان آموزش و منابع زیادی است تا بتواند بازدهی طبیعی‌تر ارائه کند.   در همین راستا به نظر می‌رسد محققان چینی و مایکروسافت راه‌حلی ایده آل برای این امر یافته‌اند. آنها یک سیستم هوش مصنوعی تبدیل متن به صوت ابداع کرده‌اند که می‌تواند فقط با کمک 200 نمونه صوتی (معادل 20 دقیقه)، فایل صوتی طبیعی تولید کند.   این سیستم به شبکه‌های عصبی عمیقی تکیه دارد که عملکرد نورون‌های مغز را تقلید می‌کنند. این شبکه عصبی عمیق هر اطلاعات ورودی و خروجی را روی لینک‌های سیناپسی می‌سنجد و به این ترتیب به آنها کمک می‌کند هر...
    محققان چینی و مایکروسافت به تازگی یک سیستم هوش مصنوعی برای تبدیل متن به صوت ابداع کرده‌اند که با کمک 200 نمونه یک فایل صوتی بسیار طبیعی تولید کند.به گزارش بلاغ،به نقل از انگجت، محققان چینی و مایکروسافت یک سیستم هوش مصنوعی برای تبدیل متن به صوت ابداع کرده اند که با کمک 200 نمونه یک فایل صوتی بسیار طبیعی تولید کند. در حالی‌که سیستم‌های مختلفی در تلاش هستند تا فناوری تبدیل متن به صوت پیشرفت کند اما مشکلات بسیاری سر راه این هوشمندسازی قرار دارند که منجر به اتلاف هزینه و وقت زیادی می‌شوند. محققان چینی و مایکروسافت برای حل این مشکلات یک سیستم هوش مصنوعی ابداع کرده‌اند که با کمک 200 نمونه فایل صوتی که معادل در نهایت...
    به گزارش خبرگزاری مهر به نقل از انگجت، فناوری تبدیل متن به صوت هر روز هوشمندتر می‌شود اما هنوز مشکلی در مسیر پیشرفت آن وجود دارد. این فناوری هنوز هم نیازمند مدت زمان آموزش و منابع زیادی است تا بتواند بازدهی طبیعی‌تر ارائه کند. در همین راستا به نظر می‌رسد محققان چینی و مایکروسافت راه حلی ایده آل برای این امر یافته اند. آنها یک سیستم هوش مصنوعی تبدیل متن به صوت ابداع کرده اند که می‌تواند فقط با کمک ۲۰۰ نمونه صوتی (معادل ۲۰ دقیقه)، فایل صوتی طبیعی تولید کند. این سیستم به شبکه‌های عصبی عمیقی تکیه دارد که عملکرد نورون‌های مغز را تقلید می‌کنند. این شبکه عصبی عمیق هر اطلاعات ورودی و خروجی را روی لینک‌های سیناپسی می‌سنجد...
    هوش مصنوعی مفهوم جدیدی است که از طرح آن چند سالی بیشتر نمی‌گذرد. این فناوری نوین با تاثیر چشمگیری که داشته، توانسته زندگی روزمره را راحت‌تر کند. خانه‌های هوشمند و تجهیزات اداری، تجاری و دیجیتال هوشمند نمونه‌هایی از استفاده از قابلیت‌های هوش مصنوعی در دنیای مدرن است. امروزه به‌راحتی از زمان حرکت با خودرو می‌توانید با استفاده از سیستم‌های ترافیکی هوشمند، مسیر‌های پرترافیک را از خانه تا محل کار با نقشه‌های هوشمند کنترل کرده و خلوت‌ترین مسیر‌ها را برای تردد انتخاب کنید.اما این تحول تنها به این موارد ختم نمی‌شود، از هوش مصنوعی در عرصه آموزش در دانشگاه‌ها هم می‌توان استفاده کرد. با ورود هوش مصنوعی به دانشگاه‌ها و سیستم‌های آموزش عالی، موسسات آموزشی موظفند فناوری‌های نوین مرتبط با این...
    خبرگزاري آريا - گوگل نيز همانند هر شرکت ديگري، مي خواهد خروجي گفتاري محصولاتش تا جاي ممکن واقعي و طبيعي به نظر برسد. براي حصول اين نتيجه مي توان از يک هنرپيشه معروف و خوش صدا (مثلاً اسکارلت يوهانسون) بخواهيم تمام کلمات و عبارات و آواهاي مختلف را ادا کند و سپس با استفاده از نرم افزاري پيچيده آنها را با هم ترکيب نماييم، اما اين روش براي گوگل چندان هيجان انگيز نيست.غول تکنولوژي مانتن ويو به تازگي از سامانه جديدي تحت عنوان «تاکوترون» (Tacotron) رونمايي کرده که از فنون يادگيري عميق (deep learning) براي تبديل نوشته به گفتار بهره مي گيرد. تاکوترون قادر است ويژگي هاي عروضي (تُن و آهنگ موسيقايي گفتار) را رعايت کند، ابهام معنايي (مانند...
۱