Публикации по теме 'computer-vision'
Создание функции мгновенного обнаружения изображений
Кент Брюстер | Инженер Pinterest, Разработка продуктов
В прошлом месяце мы запустили визуальный поиск в нашем расширении браузера для Chrome . После того, как мы его отправили, мы заметили много кликов по аннотациям с надписью Веб-сайт . При более внимательном рассмотрении выяснилось, что это всегда были результаты поиска, исходящие из контекстного меню, которое запускает визуальный поиск по сгенерированному снимку экрана из окна браузера. (Чтобы попробовать это в Chrome, щелкните..
Сегментация экземпляров с помощью машинного обучения Azure и AutoML
Вам не нужно работать в области искусственного интеллекта (ИИ), чтобы быть ошеломленным достижениями, достигнутыми в этой области в недавнем прошлом. Это откровение могло также прийти через случайное цифровое взаимодействие, такое как прокрутка фотопленки вашего iPhone, и при нажатии на изображение оно внезапно отделяет человека от изображения и удаляет фон (это недавно меня удивило, попробуйте!). Мы будем использовать ту же технику, что и Apple здесь , и знаете что, она гораздо..
Еженедельный обзор arXiv #12
Приветствую, Среднее сообщество,
В этом выпуске представлены публикации, опубликованные на arXiv с 10 по 16 июня, и представлены идеи и анализ наиболее значимых исследований и тенденций.
Давайте погрузимся!
Использование моделей большого языка для понимания изображений на основе масштабируемой векторной графики
Преодоление разрыва между текстом и визуальными модальностями.
В последнее время большие языковые модели (LLM) добились значительных успехов в понимании и генерации..
Введение в обнаружение объектов для компьютерного зрения и искусственного интеллекта
Люди могут легко обнаруживать и идентифицировать объекты, присутствующие на изображении. Зрительная система человека работает быстро и точно и может выполнять сложные задачи, такие как идентификация нескольких объектов и обнаружение препятствий, не задумываясь. Благодаря наличию больших объемов данных, более быстрых графических процессоров и лучших алгоритмов теперь мы можем легко обучать компьютеры обнаруживать и классифицировать несколько объектов на изображении с высокой точностью...
Визуальная реклама и глубокое обучение
EvalAI: оценка современного состояния искусственного интеллекта EvalAI — это веб-платформа с открытым исходным кодом для организации и участия в соревнованиях по продвижению современного искусственного интеллекта… em>evalai.cloudcv.org
Понимание образа имеет решающее значение, и это очень интересно. Некоторые изображения созданы искусственно, например, реклама. Что мы можем сделать в этой области?
Помните, что у людей, которые..
Модели компьютерного зрения — Прекратите навешивать ярлыки на пол.
Мы должны активно учитывать, как технологии влияют на ЛГБТ-сообщество, особенно на тех, кто является трансгендерным, небинарным, интерсексуальным и другим, кто не подпадает под цис-сообщество. Решая проблему гендерного и расового неравенства в технологиях, мы должны и впредь учитывать потребности всех маргинализированных сообществ.
Если рассматривать пол как бинарную классификацию…
Люди @ Voxel51: Лэнни Ван в центре внимания
В прошлом месяце мы начали серию постов, чтобы познакомить вас с некоторыми из этих замечательных людей в нашей команде. Мы надеемся, что вы сможете получить представление о том, каково это работать в Voxel51 — непосредственно от команды, которая продвигает нашу миссию вперед.
Какова наша миссия? Каждый день мы просыпаемся с миссией сделать мировые данные прозрачными и четкими. Это волнующая и значимая работа, но она не происходит в вакууме — это продукт сообщества и команды, которые..