У кого-то семь пальцев, у кого-то очень длинная ладонь: почему системы искусственного интеллекта не могут нормально изобразить руки людей
Опубликованно 08.02.2023 11:27
Рaзрaбoтчики систeм нa бaзe искусствeннoгo интeллeктa (ИИ) oткрывaют всe нoвыe гoризoнты рaзвития свoиx прoдуктoв. Прoрывы имeют мeстo в сфeрax искусствa, Интeрнeтe, oбрaзoвaнии и т.д. И тeм удивитeльнee, чтo нeкoтoрыe прoстыe зaдaчи oстaются нeпoдвлaстными ИИ. Кaк ни стрaннo, "разумный" кoмпьютeр дo сиx пoр нe нaучился кaк слeдуeт рисoвaть чeлoвeчeскую руку.
О проблеме из чего следует известно, когда сейчас несколько нейросетей сталкивались с трудностями возле изображении рук. Более всего внимания было привлечено системой Midjourney, которая должна была построить коллекцию изображений участников Twitter. Бери первый взгляд изображения выглядели беда правдоподобно и привлекательно. Одначе нельзя было малограмотный заметить, что у кого-ведь из пользователей было семь пальцев, у кого-ведь слишком длинная ладоша, а кого-то и ни на полушку три руки.
Наименьшее количество представлений
Как объясняют ученые-компьютерщики, заковырка реалистического изображения человеческой грабки нейросетью заключается в сверх меры узком представлении об этой части тела у самой механизмы. Компьютер имеет больно общее представление грабли, у которой есть щипанцы, ногти, определенные внешность внешнего вида и т.д. Однако для трехмерного объемного отображения сего мало. Более того, в некоторых случаях мы говорим о контексте использования рук, скажем так, для управления гаджетом, факт может быть к тому же более далеким ото реальности.
"С самого раннего детства я был белой черный": где сейчас мутриб Витас Электрокары готова сметь почти половина россиян Берш на 12 кг и щуки: идеже порыбачить летом 2021-гоКомандировка создания образа, в рамках которого героев держит фотоаппарат, играет возьми пианино или делает определенные символы руками, может ни в какой сте завести ИИ в заколдованный круг. Все потому, а у машины нет достаточного объемного описания трехмерной модели щупальцы с особенностями ее геометрического представления в разных вариациях.
Нате пути к идеалу
Тем никак не менее, системы ИИ достигли аспидски многого в результатах своей работы, в некоторых случаях дело касается обучения для простых двухмерных изображениях. Они создают очень реалистичные образы людей, которые отнюдь не всегда можно отличить с реальных фото. Же внимательный глаз сможет сказать на большинстве таких изображений более чем грубые неточности с нарушениями законов физики.
Проблемы изображения рук интересны тем, чисто они встречаются повсеместно и тем самым обращают участливость на системное шероховатость искусственной генерации изображений людей.
Однако можно ли отредактировать эту проблему?
Учение трехмерной геометрии
Специалисты видят парад-алле в том, чтобы нейросеть научилась безлюдный (=малолюдный) просто изображать окончательный образ, а понимать его форму и неявные характеристики. Если только нужно будет отобразить объект в более сложном контексте, метода, понимающая его геометрические свойства, сможет с минимальным числом ошибок выполнить штраф.
Один из способов обучения нейросетей предполагает промер данных 3D-проектирования. Так есть 2D-изображений сделано недостаточно для технологии машинного обучения.
К слову, компашечка OpenAI уже работает в этом направлении в рамках своего проекта Point-E. Планируется, который эта система хорошенького понемножку генерировать 3D-модели бери основе текстовых подсказок. В будущем подобные нейросети смогут слагать высокодетализированные 3D-рендеринги и ажно цифровые миры.
Нашли повреждение? Пожаловаться на вещество
Категория: Юмор и Развлечения