Усиление командной работы с помощью ИИ-агентов как пространственных коллабораторов

Мариана Фернандес-Эспиноса mferna23@nd.edu 0009-0004-1116-2002 Университет Нотр-ДамНотр-ДамИндианаСША и Диего Гомес-Сара dgomezara@nd.edu 0000-0002-4609-6293 Университет Нотр-ДамНотр-ДамИндианаСША

Аннотация.

По мере сближения технологий дополненной реальности (AR) и искусственного интеллекта (ИИ) открываются новые возможности для активной поддержки ИИ-агентами совместной работы людей в иммерсивных средах. Хотя предыдущие исследования в основном сосредоточены на диадическом взаимодействии человека и ИИ, меньше внимания уделяется командам "человек-ИИ" (HATs) в AR, где ИИ выступает в роли адаптивного партнера, а не статичного инструмента. В данной позиционной статье с точки зрения динамики команд и организации работы предлагается, что ИИ-агенты в AR должны не только взаимодействовать с отдельными людьми, но и распознавать и реагировать на потребности команды в реальном времени..

Мы утверждаем, что пространственно осознанные ИИ-агенты должны динамически генерировать ресурсы, необходимые для эффективного взаимодействия, такие как виртуальные доски для мозгового штурма, модели ментальных карт для общего понимания и воспроизведение пространственных конфигураций для улучшения запоминания информации и координации задач. Этот подход выходит за рамки предопределенной ИИ-помощи в сторону контекстно-зависимых ИИ-вмешательств, оптимизирующих командную производительность и принятие решений..

Context-Awareness,Augmented Reality, Mixed Reality, Virtual Reality,Large Language Models,Human-AI Interaction

^†^†конференция: CHI 2025 Everyday AR через AI-in-the-Loop Workshop; ; ^†^†ccs: Вычислительные технологии, ориентированные на человека^†^†ccs: Вычислительные системы, ориентированные на человека Смешанная / дополненная реальность^†^†ccs: Вычислительные системы, ориентированные на человека Эмпирические исследования в области человеко-компьютерного взаимодействия^†^†ccs: Вычислительные технологии, ориентированные на человека Теория, концепции и парадигмы совместных и социальных вычислений^†^†ccs: Вычислительные системы, ориентированные на человека Совместное взаимодействие

1. Введение

Последние достижения в области устройств дополненной реальности (Augmented Reality, AR), таких как Microsoft HoloLens, (Microsoft, 2024), который использует выбор на основе взгляда и речевое управление с помощью ИИ, а также Orion от Meta (Meta, 2024), что обеспечивает повсеместное и контекстно-зависимое взаимодействие, значительно расширило возможности для совместной работы людей. (Li et al., 2019; Zhao and Baghaei, 2024). Эти технологии трансформируют способы коммуникации и совместной работы команд, объединяя цифровые и физические среды, что позволяет создавать более иммерсивные и динамичные взаимодействия между участниками..

Исследования в области взаимодействия человека с компьютером (HCI) широко изучают влияние систем онлайн-коммуникации на динамику команд и предлагают различные решения для повышения продуктивности и эффективности виртуальных встреч. (Harris et al., 2019; Tang et al., 2023; O’hara et al., 2011). Одним из таких подходов является интеграция ИИ-агентов, предназначенных для улучшения координации, облегчения коммуникации и поддержки вовлеченности. Например, система автоматического суммирования встреч "MeetingCoach", (Airgram.io, 2025; Rewatch.com, 2025), обнаруживает различные поведенческие сигналы во время встреч и объединяет их в пост-встречный дашборд для улучшения понимания динамики встреч (Samrose et al., 2021), и «Dittos», персонализированный ИИ-агент, заменяющий членов команды в их отсутствие. (Leong et al., 2024), демонстрируют потенциал ИИ для улучшения командной работы в цифровой среде.

Однако ИИ-агенты по-прежнему сталкиваются со значительными трудностями, особенно в адаптации к реальным условиям многопользовательского взаимодействия. (Paolo et al., 2024; Puig et al., 2020). Большинство систем ИИ работают в текстовых или статических средах. (Bovo et al., 2024; Cohn and Blackwell, 2024), ограничивая их способность понимать пространственные отношения, свойства объектов и взаимодействия в команде в динамических контекстах реального времени (Yan et al., 2023). Это ограничивает эффективность ИИ в обеспечении плавного и адаптивного взаимодействия в иммерсивных средах для командных встреч..

1.1. ИИ-агенты в иммерсивных средах

Для решения этих проблем исследователи XR предлагают разрабатывать ИИ-агенты, глубоко интегрированные в реальные условия, способные наблюдать, взаимодействовать и непрерывно обучаться на основе своего окружения и человеческих коллабораторов динамичным и адаптивным образом. (Hirzle et al., 2023). Перспективным применением данного подхода является разработка LLM-агентов Non-Player Character (NPC), используемых в видеоиграх. (Korkiakoski et al., [n. d.]; Kopel and Smrz, 2018), тренировочные симуляции (Mergen et al., 2023), и виртуальные пространства для совместной работы (Wan et al., 2024). Эти агенты обещают повысить вовлеченность пользователей за счет реакции на входные данные в реальном времени, адаптации к поведению человека и обеспечения интерактивного взаимодействия..

Несмотря на эти достижения, ИИ-агенты в иммерсивных средах по-прежнему имеют значительные ограничения. Современные системы на основе ИИ взаимодействуют в основном с отдельными людьми, а не поддерживают командное сотрудничество, упуская возможность использовать возможности для объединения цифровых и физических сред. Кроме того, большинство ИИ-агентов в иммерсивных средах спроектированы как статические помощники, не способные динамически адаптировать свою роль в зависимости от потребностей команды. Учитывая, что командные встречи часто включают как удалённых, так и присутствующих участников, ИИ-агенты также не понимают проксемику (личное пространство, позиционирование команды, паттерны движения), что напрямую влияет на их взаимодействие в иммерсивных условиях..

Поскольку командные встречи остаются фундаментальным аспектом организационной работы, критически важно разрабатывать ИИ-агенты, выходящие за рамки индивидуального взаимодействия и фокусирующиеся на командном поведении, паттернах координации и коллективных процессах принятия решений. Развитие ИИ-управляемой коллаборации в иммерсивных средах требует систем, способных управлять вниманием множества пользователей, поддерживать командную работу без нарушения рабочих процессов и динамически реагировать на потребности команды..

1.2. Необходимость специализированных ИИ-агентов для дополненной реальности

Хотя развивающаяся область социальных VR предоставила ценные данные о командном поведении в иммерсивных средах, (Sayadi et al., 2024), ограниченное количество исследований изучало эти динамики в дополненной реальности (Wang et al., 2019). Существующие исследования в области VR показывают, что иммерсивные среды могут влиять на сплочённость команды, вовлечённость и доверие, однако AR представляет уникальные вызовы и возможности, которые остаются в значительной степени неисследованными. (van der Land et al., 2011).

Наши предыдущие исследования (Fernandez-Espinosa et al., 2025) исследовали различия между командами, сотрудничающими в виртуальной реальности (VR), и командами, взаимодействующими лицом к лицу. В частности, мы изучили, как возможности VR влияют на ощущение близости между членами команды при её формировании. Наши результаты показали, что новички, знакомящиеся в VR, чувствовали себя более включёнными в команду по сравнению с теми, кто знакомился очно. Наша работа демонстрирует, что восприятие и отношение к сотрудничеству у членов команды формируются средой взаимодействия, а не только межличностными факторами. Таким образом, необходимо расширить исследования за пределы VR и включить дополненную реальность (AR), которая предлагает иные динамики взаимодействия, пространственные ограничения и возможности для AI-опосредованной поддержки..

2. Будущие исследования и вклад в работу семинара

В нашей будущей работе мы планируем проанализировать и использовать возможности пространственных вычислений AR в сочетании с анализом командной динамики для проектирования AI-агентов, улучшающих командные встречи. Эти AI-агенты будут функционировать как активные участники, динамически генерируя и адаптируя вспомогательные материалы для улучшения коммуникации, координации и общего понимания. Например, AI-агенты смогут создавать виртуальные доски для мозгового штурма, субтитры в реальном времени для доступности или 3D-модели по запросу, помогая командам визуализировать сложные концепции. Адаптируясь к потребностям команды в реальном времени, эти AI-агенты смогут устранять пробелы в понимании, облегчать решение задач и улучшать совместное принятие решений в иммерсивных AR-средах..

2.1. Вклад в семинар

В ходе семинара мы стремимся рассмотреть командный подход, продвигая разработку ИИ-агентов для совещаний в реальном времени. Особый интерес представляет обсуждение интеграции ИИ-агентов в AR-ориентированные рабочие процессы команд и их вклада в повышение эффективности и динамики коллаборации. Кроме того, мы планируем представить первые результаты нашего исследования ИИ-агентов в смешанной реальности, внося вклад в текущие дискуссии в научных сообществах AR и ИИ..

Опираясь на предыдущие исследования, в которых были выявлены проблемы виртуальных и очных встреч, мы предлагаем расширить обсуждение на AR-среды и рассмотреть следующие ключевые исследовательские вопросы:

•

RQ1: Каковы оптимальные архитектуры ИИ-агентов в дополненной реальности для повышения удобства использования, взаимодействия и эффективной командной работы??
•

RQ2: Какие пространственные и проксемические факторы следует учитывать в дополненной реальности для улучшения координации и вовлеченности команды??
•

RQ3: Как следует воплощать ИИ-агентов в дополненной реальности (AR), чтобы сосредоточиться на взаимодействиях на уровне команды, а не на межличностных, индивидуальных взаимодействиях??
•

RQ4: Когда и как ИИ-агенты должны вмешиваться в командные рабочие процессы в AR? Как они могут определять, когда пользователям требуется помощь, не нарушая совместную работу??

Смещая роль ИИ-агентов от предопределенных инструментов к адаптивным, контекстно-ориентированным участникам команды, мы открываем новые возможности для коллективного интеллекта в AR-средах. Решение этих исследовательских вопросов станет ключевым для проектирования ИИ-агентов, которые органично интегрируются в рабочие процессы команд, оптимизируют взаимодействие в иммерсивных пространствах и в конечном итоге повышают эффективность командной работы и принятия решений..

В рамках данного обсуждения мы стремимся углубить понимание ИИ в дополненной реальности не просто как интерфейса, а как активного инструмента, обеспечивающего совместную работу человека и ИИ..

Ссылки

(1)
Airgram.io (2025) Airgram.io. 2025. Airgram — ИИ-ассистент для автоматизированного ведения заметок и создания резюме встреч. https://www.airgram.io/
Bovo et al. (2024) Риккардо Бово, Стивен Абреу, Каран Ахуджа, Эрик Дж. Гонсалес, Ли-Те Ченг и Мар Гонсалес-Франко. 2024. Embardiment: воплощенный ИИ-агент для повышения продуктивности в XR. Препринт arXiv:2408.08158 (2024).
Кон и Блэквелл (2024) Энтони Дж. Кон и Роберт Э. Блэквелл. 2024. Могут ли большие языковые модели рассуждать в рамках Region Connection Calculus?? Препринт arXiv:2411.19589 (2024).
Фернандес-Эспиноса и др. (2025) Мариана Фернандес-Эспиноса, Кара Клаус, Дилан Селларс, Дэнни Тонг, Майкл Бсейлс, Софони Алсиндор, Тимоти Д. Хаббард, Майкл Виллано и Диего Гомес-Зара. 2025. Преодоление предвзятости знакомства: использование виртуальной реальности для улучшения формирования команд и инклюзивности. arXiv препринт arXiv:2502.09912 (2025).
Харрис и соавт. (2019) Алекса М. Харрис, Диего Гомес-Зара, Лесли А. ДеЧёрч и Ношир С. Контрактор. 2019.. Объединение в онлайн-среде: траектория исследований CSCW в области формирования групп. Труды ACM по взаимодействию человека и компьютера 3, CSCW (2019), 1–27.
Hirzle et al. (2023) Тереза Хирцле, Флориан Мюллер, Фиона Дракслер, Мартин Шмитц, Паскаль Книрим и Каспер Хорнбек. 2023. Когда XR и ИИ встречаются — обзорный анализ взаимодействия расширенной реальности и искусственного интеллекта. В Труды конференции CHI 2023 по человеческому фактору в вычислительных системах. ACM, 1–45. doi:10.1145/3544548.3581072
Копел и Шмрж (2018)) Марек Копель и Павел Смрж. 2018. Реализация искусственного интеллекта для неигровых персонажей в 3D-видеоиграх. В Достижения в области интеллектуальных систем и вычислений. Том 659. Springer, 637–646. doi:10.1007/978-3-319-75417-8_57
Коркиакоски и др. ([б. г.]).]) Микко Коркиакоски, Саид Шейхи, Калле Тапио, Йеспер Нюман, Юсси Саариниеми и Панос Костакос. [б. г.]..]. Эмпирическая оценка воспринимаемого реализма и производительности неигровых персонажей на основе искусственного интеллекта в виртуальной реальности. Доступно на SSRN 5148461 ([н. д..]).
Leong et al. (2024) Джоанн Леонг, Джон Танг, Эдвард Катрелл, Саса Юнузович, Грегори Пол Барибо и Кори Инкпен. 2024. Dittos: Персонализированные, воплощённые агенты, участвующие в собраниях в ваше отсутствие. Труды ACM по взаимодействию человека и компьютера 8, CSCW2 (2024), 1–28.
Ли и др. (2019) Чжэнь Ли, Мишель Эннетт, Кен Хинкли, Каран Сингх и Дэниел Вигдор. 2019.. Holodoc: Реализация смешанной реальности для рабочих пространств, объединяющих физический и цифровой контент. В Труды конференции CHI 2019 по вопросам человеческого фактора в вычислительных системах. 1–14.
Mergen et al. (2023) Марвин Мерген, Анна Юнга, Бенджамин Риссе, Димитар Вальков, Норберт Граф и Бернхард Маршалл. 2023. Иммерсивное обучение клиническому принятию решений с использованием виртуальных пациентов на основе ИИ — новая VR-платформа под названием medical tr.AI.ning. Журнал GMS по медицинскому образованию 40, 2 (2023), Doc19. doi:10.3205/zma001600
Meta (2024) Meta. 2024. Представляем Orion: наши первые настоящие очки дополненной реальности. https://about.fb.com/news/2024/09/introducing-orion-our-first
Microsoft (2024) Microsoft. 2024. Взгляд и действие — проектирование для HoloLens. https://learn.microsoft.com/en-us/windows/mixed-reality/design/gaze-and-commit Доступ: 2025-02-20.
О’Хара и др. (2011) Кентон О’Хара, Йеспер Кьельдсков и Джени Паай. 2011. Смешанные пространства взаимодействия для распределенного командного сотрудничества. ACM Transactions on Computer-Human Interaction (TOCHI) 18, 1 (2011), 1–28.
Паоло и др. (2024)) Джузеппе Паоло, Йонас Гонсалес-Бильандон и Балаж Кегл. 2024. Призыв к воплощённому искусственному интеллекту. Препринт arXiv:2402.03824 (2024).
Пуиг и др. (2020) Ксавье Пуиг, Тяньмин Шу, Шуан Ли, Цзылинь Ван, Юань-Хун Ляо, Джошуа Б. Тененбаум, Санья Фидлер и Антонио Торральба. 2020. Watch-and-help: вызов для социального восприятия и взаимодействия человека и ИИ. Препринт arXiv:2010.09890 (2020).
Rewatch.com (2025) Rewatch.com. 2025. Пересмотр. https://rewatch.com/
Samrose et al. (2021) Самиха Самроуз, Дэниел Макдафф, Роберт Сим, Джина Су, Каэл Роуэн, Хавьер Эрнандес, Шон Ринтел, Кевин Мойнихэн и Мэри Червински. 2021.. Meetingcoach: интеллектуальная панель для поддержки эффективных и инклюзивных совещаний. В Труды конференции CHI 2021 по человеческим факторам в вычислительных системах. 1–13.
Саяди и др. (2024) Ниллуфар Саяди, Сейди Ко и Диего Гомес-Зара. 2024. ” «Ощущение, что я сотрудничал с ними»: 20-летний систематический обзор литературы по социальным виртуальным реальностям, способствующим коллаборации. arXiv препринт arXiv:2412.20266 (2024).
Танг и соавт. (2023) Джон К. Танг, Кори Инкпен, Саса Юнузович, Кери Маллари, Эндрю Д. Уилсон, Шон Ринтел, Шираз Купала, Тони Карбари, Абигейл Селлен и Уильям А.С. Бакстон. 2023. Перспективы: создание инклюзивного и равноправного опыта гибридных встреч. Труды ACM по взаимодействию человека с компьютером 7, CSCW2 (2023), 1–25.
ван дер Ланд и др. (2011) Сара Ф. ван дер Ланд, Александр П. Схаутен, Барт Й. ван ден Хофф и Франс Фельдберг. 2011.. Моделирование метавселенной: теоретическая модель эффективного командного взаимодействия в трёхмерных виртуальных средах. Журнал исследований виртуальных миров 4, 3 (2011), 1–17. doi:10.4101/jvwr.v4i3.6126
Ван и др. (2024) Хунъю Вань, Цзиньда Чжан, Абдулазиз Ариф Сурия, Биншэн Яо, Дакуо Ван, Йоланда Коди и Майя Прпа. 2024. Построение LLM-агентов на основе искусственного интеллекта в социальной виртуальной реальности. В Труды конференции CHI 2024 по вопросам человеческого фактора в вычислительных системах. Ассоциация вычислительной техники. doi:10.1145/3613905.3651026
Ван и др. (2019) Айзек Ван, Джесси Смит и Хайме Руис. 2019. Исследование виртуальных агентов для дополненной реальности. В Труды конференции CHI 2019 по вопросам взаимодействия человека и компьютера. 1–12.
Ян и соавт. (2023) Хэ Янь, Синьяо Ху, Сянпэн Вань, Чэнъюй Хуан, Кай Цзоу и Шици Сюй. 2023. Врожденные ограничения LLM в отношении пространственной информации. Препринт arXiv:2312.03042 (2023).
Чжао и Багхаи (2024) Иньшу Чжао и Нилуфар Багхаи. 2024. Исследование модальностей взаимодействия с ИИ в виртуальных средах и их влияния. Влияние искусственного интеллекта на общества (2024), 41.