Публикации по тегам computer-vision

Публикации по теме 'computer-vision'

Создание функции мгновенного обнаружения изображений

Кент Брюстер | Инженер Pinterest, Разработка продуктов В прошлом месяце мы запустили визуальный поиск в нашем расширении браузера для Chrome . После того, как мы его отправили, мы заметили много кликов по аннотациям с надписью Веб-сайт . При более внимательном рассмотрении выяснилось, что это всегда были результаты поиска, исходящие из контекстного меню, которое запускает визуальный поиск по сгенерированному снимку экрана из окна браузера. (Чтобы попробовать это в Chrome, щелкните..

Сегментация экземпляров с помощью машинного обучения Azure и AutoML

Вам не нужно работать в области искусственного интеллекта (ИИ), чтобы быть ошеломленным достижениями, достигнутыми в этой области в недавнем прошлом. Это откровение могло также прийти через случайное цифровое взаимодействие, такое как прокрутка фотопленки вашего iPhone, и при нажатии на изображение оно внезапно отделяет человека от изображения и удаляет фон (это недавно меня удивило, попробуйте!). Мы будем использовать ту же технику, что и Apple здесь , и знаете что, она гораздо..

Еженедельный обзор arXiv #12

Приветствую, Среднее сообщество, В этом выпуске представлены публикации, опубликованные на arXiv с 10 по 16 июня, и представлены идеи и анализ наиболее значимых исследований и тенденций. Давайте погрузимся! Использование моделей большого языка для понимания изображений на основе масштабируемой векторной графики Преодоление разрыва между текстом и визуальными модальностями. В последнее время большие языковые модели (LLM) добились значительных успехов в понимании и генерации..

Введение в обнаружение объектов для компьютерного зрения и искусственного интеллекта

Люди могут легко обнаруживать и идентифицировать объекты, присутствующие на изображении. Зрительная система человека работает быстро и точно и может выполнять сложные задачи, такие как идентификация нескольких объектов и обнаружение препятствий, не задумываясь. Благодаря наличию больших объемов данных, более быстрых графических процессоров и лучших алгоритмов теперь мы можем легко обучать компьютеры обнаруживать и классифицировать несколько объектов на изображении с высокой точностью...

Визуальная реклама и глубокое обучение

EvalAI: оценка современного состояния искусственного интеллекта EvalAI — это веб-платформа с открытым исходным кодом для организации и участия в соревнованиях по продвижению современного искусственного интеллекта… em>evalai.cloudcv.org Понимание образа имеет решающее значение, и это очень интересно. Некоторые изображения созданы искусственно, например, реклама. Что мы можем сделать в этой области? Помните, что у людей, которые..

Модели компьютерного зрения — Прекратите навешивать ярлыки на пол.

Мы должны активно учитывать, как технологии влияют на ЛГБТ-сообщество, особенно на тех, кто является трансгендерным, небинарным, интерсексуальным и другим, кто не подпадает под цис-сообщество. Решая проблему гендерного и расового неравенства в технологиях, мы должны и впредь учитывать потребности всех маргинализированных сообществ. Если рассматривать пол как бинарную классификацию…

Люди @ Voxel51: Лэнни Ван в центре внимания

В прошлом месяце мы начали серию постов, чтобы познакомить вас с некоторыми из этих замечательных людей в нашей команде. Мы надеемся, что вы сможете получить представление о том, каково это работать в Voxel51 — непосредственно от команды, которая продвигает нашу миссию вперед. Какова наша миссия? Каждый день мы просыпаемся с миссией сделать мировые данные прозрачными и четкими. Это волнующая и значимая работа, но она не происходит в вакууме — это продукт сообщества и команды, которые..