У кого-то семь пальцев, у кого-то очень длинная ладонь: почему системы искусственного интеллекта не могут нормально изобразить руки людей


Опубликованно 08.02.2023 11:27

У кого-то семь пальцев, у кого-то очень длинная ладонь: почему системы искусственного интеллекта не могут нормально изобразить руки людей

Рaзрaбoтчики систeм нa бaзe искусствeннoгo интeллeктa (ИИ) oткрывaют всe нoвыe гoризoнты рaзвития свoиx прoдуктoв. Прoрывы имeют мeстo в сфeрax искусствa, Интeрнeтe, oбрaзoвaнии и т.д. И тeм удивитeльнee, чтo нeкoтoрыe прoстыe зaдaчи oстaются нeпoдвлaстными ИИ. Кaк ни стрaннo, "разумный" кoмпьютeр дo сиx пoр нe нaучился кaк слeдуeт рисoвaть чeлoвeчeскую руку.

О проблеме из чего следует известно, когда сейчас несколько нейросетей сталкивались с трудностями возле изображении рук. Более всего внимания было привлечено системой Midjourney, которая должна была построить коллекцию изображений участников Twitter. Бери первый взгляд изображения выглядели беда правдоподобно и привлекательно. Одначе нельзя было малограмотный заметить, что у кого-ведь из пользователей было семь пальцев, у кого-ведь слишком длинная ладоша, а кого-то и ни на полушку три руки.

Наименьшее количество представлений

Как объясняют ученые-компьютерщики, заковырка реалистического изображения человеческой грабки нейросетью заключается в сверх меры узком представлении об этой части тела у самой механизмы. Компьютер имеет больно общее представление грабли, у которой есть щипанцы, ногти, определенные внешность внешнего вида и т.д. Однако для трехмерного объемного отображения сего мало. Более того, в некоторых случаях мы говорим о контексте использования рук, скажем так, для управления гаджетом, факт может быть к тому же более далеким ото реальности.

"С самого раннего детства я был белой черный": где сейчас мутриб Витас Электрокары готова сметь почти половина россиян Берш на 12 кг и щуки: идеже порыбачить летом 2021-го

Командировка создания образа, в рамках которого героев держит фотоаппарат, играет возьми пианино или делает определенные символы руками, может ни в какой сте завести ИИ в заколдованный круг. Все потому, а у машины нет достаточного объемного описания трехмерной модели щупальцы с особенностями ее геометрического представления в разных вариациях.

Нате пути к идеалу

Тем никак не менее, системы ИИ достигли аспидски многого в результатах своей работы, в некоторых случаях дело касается обучения для простых двухмерных изображениях. Они создают очень реалистичные образы людей, которые отнюдь не всегда можно отличить с реальных фото. Же внимательный глаз сможет сказать на большинстве таких изображений более чем грубые неточности с нарушениями законов физики.

Проблемы изображения рук интересны тем, чисто они встречаются повсеместно и тем самым обращают участливость на системное шероховатость искусственной генерации изображений людей.

Однако можно ли отредактировать эту проблему?

Учение трехмерной геометрии

Специалисты видят парад-алле в том, чтобы нейросеть научилась безлюдный (=малолюдный) просто изображать окончательный образ, а понимать его форму и неявные характеристики. Если только нужно будет отобразить объект в более сложном контексте, метода, понимающая его геометрические свойства, сможет с минимальным числом ошибок выполнить штраф.

Один из способов обучения нейросетей предполагает промер данных 3D-проектирования. Так есть 2D-изображений сделано недостаточно для технологии машинного обучения.

К слову, компашечка OpenAI уже работает в этом направлении в рамках своего проекта Point-E. Планируется, который эта система хорошенького понемножку генерировать 3D-модели бери основе текстовых подсказок. В будущем подобные нейросети смогут слагать высокодетализированные 3D-рендеринги и ажно цифровые миры.

Нашли повреждение? Пожаловаться на вещество



Категория: Юмор и Развлечения