خلاصه: محققان با آموزش یک سیستم هوش مصنوعی هوش مصنوعی به زبان ساده برای کودکان چندوجهی تنها با استفاده از ورودی هایی که یک کودک از بدو تولد تا تولد دوم خود دریافت می کند، به پیشرفت قابل توجهی دست یافتند و این تصور را که هوش مصنوعی برای یادگیری زبان به داده های گسترده ای نیاز دارد، به چالش می کشد.
مطالعه آنها نشان میدهد که مدل هوش مصنوعی هوش مصنوعی به زبان ساده برای کودکان قادر به یادگیری کلمات و مفاهیم از بخشی از تجربیات یک کودک است که از طریق ضبطهای دوربین سر گرفته شده است. این آزمایش پتانسیل هوش مصنوعی را برای تقلید از فرآیندهای یادگیری زبان انسانی برجسته میکند و درک ما از درک اولیه زبان و مفهوم را تغییر میدهد.
محققان با همسو کردن یادگیری هوش مصنوعی با هوش مصنوعی به زبان ساده برای کودکان تجربه طبیعتگرایانه کودک، بینشهای جدیدی را در مورد بحث در مورد نحوه یادگیری زبان کودکان ارائه میکنند و نشان میدهند که یادگیری تداعی ممکن است نقش مهمتری نسبت به آنچه قبلا تصور میشد بازی کند.
حقایق کلیدی:
سیستم هوش مصنوعی که بر روی فیلم دوربین س هوش مصنوعی به زبان ساده برای کودکان ر از یک کودک مجرد آموزش دیده بود، توانست تعداد قابل توجهی از کلمات و مفاهیم را بیاموزد، علیرغم اینکه ویدیو تنها حدود 1٪ از ساعات بیداری کودک را ضبط می کرد.
این مطالعه از یک شبکه عصبی چندوجهی استفاده کرد که دادههای بصری و زبانی را از طریق یادگیری متضاد ترکیب میکند تا از روشی که کودکان کلمات را با زمینههای بصری پیوند هوش مصنوعی به زبان ساده برای کودکان میدهند، تقلید کند.
این تحقیق باورهای سنتی در مورد یادگیری زبان را به چالش میکشد و نشان میدهد که یادگیری تداعی با حداقل ورودی میتواند به فراگیری زبان قابل توجهی مانند کودکان انسان منجر شود.
منبع: NYU
سیستمهای هوش مصنوعی، مانند GPT-4، اکنون میتوانند زبان انسانی را یاد بگیرند و از آن استفاده کنند، اما از مقادیر نجومی ورودی زبان یاد میگیرند - بسیار بیشتر از آنچه کودکان هنگام یادگیری نحوه درک و صحبت کردن یک زبان دریافت میکنند. بهترین سیستمهای هوش مصنوعی بر روی متن با تعداد کلمات هوش مصنوعی به زبان ساده برای کودکان تریلیونها آموزش میدهند، در حالی که کودکان سالانه میلیونها کلمه دریافت میکنند.
با توجه به این شکاف عظیم داده ها، محققان نسبت به این که پیشرفت های اخیر هوش مصنوعی می تواند چیزهای زیادی در مورد یادگیری و توسعه انسان به ما بگوید، تردید دارند. یک آزمایش ایده آل برای نشان دادن یک اتصال شامل آموزش یک مدل هوش مصنوعی است، نه بر روی داده های عظیم از وب، بلکه فقط بر روی ورودی هایی که یک کودک دریافت می کند. در آن صورت مدل می تواند چه چیزی را یاد بگیرد؟
اعتبار: NYU
تیمی از محققان دانشگاه نیویورک دقیقا این آزمایش را انجام دادند. آنها یک سیستم هوش مصنوعی چندوجهی را از طریق چشم ها و گوش های یک کودک مجرد، با استفاده از فیلم های ضبط شده با دوربین سر از زمانی که کودک شش ماهه بود و تا دو سالگی او آموزش دادند. آنها بررسی کردند که آیا مدل هوش مصنوعی می تواند کلمات و مفاهیم موجود در تجربه روزمره کودک را بیاموزد یا خیر.
یافتههای آنها که در آخرین شماره مجله Science گزارش هوش مصنوعی به زبان ساده برای کودکان شد، نشان داد که این مدل یا شبکه عصبی، در واقع میتواند تعداد قابل توجهی از کلمات و مفاهیم را با استفاده از برشهای محدودی از آنچه کودک تجربه کرده است، بیاموزد. به این معنا که این ویدیو تنها حدود 1 درصد از ساعات بیداری کودک را ضبط کرده است، اما این برای یادگیری زبان واقعی کافی بود.
وای کین وونگ، دانشمند پژوهشی در مرکز علوم داده دانشگاه نیویورک هوش مصنوعی به زبان ساده برای کودکان میگوید: ما برای اولین بار نشان میدهیم که یک شبکه عصبی که بر اساس این ورودی واقعگرایانه رشدی از یک کودک آموزش دیده است، میتواند یاد بگیرد که کلمات را به همتایان بصری خود پیوند دهد. اولین نویسنده مقاله
«نتایج ما نشان میدهد که چگونه پیشرفتهای الگوریتمی اخیر همراه با تجربه طبیعتگرایانه یک کودک، این پتانسیل را دارد که درک ما از زبان اولیه و اکتساب مفاهیم را تغییر دهد.»
با استفاده از مدلهای هوش مصنوعی برای مطالعه مشکل واقعی یادگیری زبان که کودکان با آن مواجه هستند، میتوانیم به بحثهای کلاسیک درباره اینکه کودکان برای یادگیری لغات به چه عناصری نیاز دارند، بپردازیم - اینکه آیا آنها برای ادامه کار به تعصبات خاص زبان، دانش ذاتی یا فقط یادگیری تداعی نیاز دارند. برندن لیک، استادیار مرکز علوم داده و گروه روانشناسی دانشگاه نیویورک و نویسنده ارشد مقاله میافزاید.
"به نظر می رسد ما می توانیم با یادگیری بیشتر از آنچه که معمولاً تصور می شود به دست آوریم."
این یک کودک و یک ربات را نشان می دهد.
به عنوان مثال، هنگامی که والدین چیزی را در نظر کودک هوش مصنوعی به زبان ساده برای کودکان می گویند، احتمالاً برخی از کلمات استفاده شده به چیزی اشاره دارد که کودک می تواند ببیند، به این معنی که درک با پیوند دادن نشانه های بصری و زبانی القا می شود. اعتبار: اخبار علوم اعصاب
وونگ، لیک و همکارانشان در دانشگاه نیویورک، ونتائو وانگ و امین اورهان، فرآیند یادگیری کودک را که در ویدئوی اول شخص گرفته شده بود - از طریق یک دوربین سبک و سر، به صورت هفتگی از شش ماهگی و تا 25 ماهگی با استفاده از آن تجزیه و تحلیل کردند. بیش از 60 ساعت فیلم
این فیلم حاوی تقریباً یک چهارم میلیون نمونه کلمه (یعنی تعداد کلمات ارسال شده، بسیاری از آنها به طور مکرر) بود که با فریم های ویدیویی از آنچه کودک هنگام گفتن آن کلمات دیده بود مرتبط است و شامل طیف گسترده ای از فعالیت های مختلف در سراسر جهان است. رشد، از جمله زمان صرف غذا، خواندن کتاب و بازی کودک.
محققان دانشگاه نیویورک سپس یک شبکه عصبی چندوجهی را با دو ماژول مجزا آموزش دادند: یکی که فریمهای ویدئویی منفرد (رمزگذار بینایی) را میگیرد و دیگری که گفتار رونویسی شده توسط کودک (رمزگذار زبان) را میگیرد.
این دو رمزگذار با استفاده از الگوریتمی به نام Contra Artificial intelligence in plain language for children s ترکیب و آموزش داده شدند