µô¸®¼Å½º, AI ¿¬±¸ ³í¹® 2°Ç ¼¼°è ÃÖ°í ±ÇÀ§ ÇÐȸ CVPR 2024 ¹ßÇ¥

  • ÁÖ¼Ò º¹»ç
  • ¹êµå °øÀ¯
  • ³×À̹ö °øÀ¯
  • Ä«Ä«¿ÀÅå °øÀ¯
  • ÆäÀ̽ººÏ °øÀ¯
  • Æ®À§ÅÍ °øÀ¯
½Å»ó¸¶ÄÏÀÇ ¿î¿µ»ç µô¸®¼Å½º(´ëÇ¥ ±èÁØÈ£, Á¤Ã¢ÇÑ)°¡ ¡®CVPR (Computer Vision and Pattern Recognition) 2024¡¯¿¡¼­ ÀΰøÁö´É(AI) ±â¼ú ³í¹® 2ÆíÀ» ¿¬´Þ¾Æ ¹ßÇ¥ÇÑ´Ù°í 30ÀÏ ¹àÇû´Ù.

ÄÄÇ»ÅͺñÀü ¹× ÆÐÅÏÀνÄÇÐȸ(CVPR)´Â ÄÄÇ»ÅÍ ºñÀü ¹× ÆÐÅÏÀÎ½Ä ºÐ¾ß¿¡¼­ ¼¼°è Á¤»ó±Þ ±ÇÀ§¸¦ °¡Áø ÇÐȸ·Î ¼Õ²ÅÈ÷¸ç, ¿À´Â 6¿ù ½Ã¾ÖƲ¿¡¼­ ¿ÃÇØ ÄÁÆÛ·±½º°¡ °³ÃֵȴÙ. µô¸®¼Å½º´Â CVPR 2024¿¡¼­ ¡®À̹ÌÁö °Ë»ö µ¥ÀÌÅÍÀÇ ÇнÀ-Å×½ºÆ® Ŭ·¡½º Áߺ¹ ÇØ°á ¹× À̹ÌÁö °Ë»ö ±â¹ý Á¦¾È(On Train-Test Class Overlap and Detection for Image Retrieval, ¼Ûöȯ, À±ÁÖ¿µ, ȲŹé, ÃÖ¼ºÇö, ±¸¿µÇö, Yannis Avrithis °øÀú)¡¯ ¹× ¡®µ¿±âÈ­ ¸¶½ºÅ©: ÆÐ¼Ç µµ¸ÞÀÎÀÇ ºñÀü-·©±ÍÁö ÇнÀÀ» À§ÇØ µ¿±âÈ­µÈ ÁýÁß ¸¶½ºÅ· ±â¹ý(SyncMask: Synchronized Attentional Masking for Fashion-centric Vision-Language Pretraining, ¼Ûöȯ, ȲŹé, À±ÁÖ¿µ, ÃÖ¼ºÇö, ±¸¿µÇö °øÀú)¡¯ ¿¬±¸³í¹® 2°ÇÀ» ¹ßÇ¥ÇÑ´Ù.

ù ¹ø° ³í¹® ¡®On Train-Test Class Overlap and Detection for Image Retrieval¡¯Àº ±âÁ¸ ¿¬±¸¿¡¼­ ÁÖ·Î »ç¿ëÇÏ´ø ÇнÀ ¼¼Æ®(Training set)¿Í Æò°¡ ¼¼Æ®(Evaluation set)¿¡ Áߺ¹µÈ µ¥ÀÌÅÍ°¡ ÀÖ´Ù´Â Á¡À» ¹ß°ßÇØ À̸¦ Á¤Á¦ÇÑ »õ·Î¿î µ¥ÀÌÅͼÂÀ» Á¦¾ÈÇß´Ù. ÀÌ Á¤Á¦ÇÑ µ¥ÀÌÅͼÂÀ» È°¿ëÇØ ÁøÇàÇÑ ½ÇÇè¿¡¼­´Â ±âÁ¸¿¡ µÎ ´Ü°è(Two-stage)¸¦ °ÅÃÄ ÁøÇàÇÏ´ø À̹ÌÁö °Ë»ö ¹æ½ÄÀ» ÇÑ ´Ü°è(One-stage)·Î ÁÙ¿© º¸´Ù È¿À²ÀûÀ¸·Î °Ë»öÀ» °¡´ÉÄÉ ÇÏ´Â µ¿½Ã¿¡ ÇöÁ¸ °¡Àå ¶Ù¾î³­ ¼º´ÉÀ» ¼±º¸¿´´Ù.

¡®SyncMask: Synchronized Attentional Masking for Fashion-centric Vision-Language Pretraining¡¯ ¿¬±¸¿¡¼­´Â ¼¼°è ÃÖÃÊ·Î À̹ÌÁö¿Í ÅؽºÆ®¸¦ È¥ÇÕÇÑ ¸ÖƼ¸ð´Þ(Multi-modal)¿¡ µ¿±âÈ­µÈ ÁýÁß ¸¶½ºÅ·(Synchronized Attentional Masking)À» Àû¿ëÇÏ°íµµ ÇöÁ¸ ÃÖ°í ¼öÁØÀÇ °á°ú¸¦ ±â·ÏÇß´Ù. ±âÁ¸ ¿¬±¸µéÀº À̹ÌÁö ȤÀº ÅؽºÆ®ÀÇ ºÒƯÁ¤ ºÎºÐÀ» ºÒ±ÔÄ¢ÀûÀ¸·Î °¡·Á °Ë»ö°ªÀ» µµÃâÇÏ´Â ¹æ½ÄÀ̾úÀ¸³ª, À̹ø ¿¬±¸´Â À̹ÌÁö¿Í ÅؽºÆ®ÀÇ Áß¿äÇÑ ºÎºÐÀ» ÀÏÁ¤ÇÏ°Ô ¸ðµÎ °¡¸®°íµµ ¿øº»¿¡ ¸Â´Â Á¤È®ÇÑ °ªÀ» µµÃâÇÏ´Â ¼º´ÉÀ» º¸¿´´Ù. ÀÌ ¿¬±¸ °á°ú´Â ÇâÈÄ À̹ÌÁö, ¶Ç´Â ÅؽºÆ®¸¸ ÀÖ´Â »óȲ¿¡¼­µµ Á¤È®µµ ³ôÀº °Ë»ö °á°ú¸¦ µµÃâÇÏ´Â µ¥ ±â¿©ÇÒ ¼ö ÀÖ´Ù.

³í¹®ÀÇ ÁÖ ÀúÀÚÀÎ ¼Ûöȯ ¿¬±¸¿øÀº ¡°¼¼°èÀûÀÎ 3´ë ÇÐȸ¿¡ 4ÆíÀÇ ¿¬±¸³í¹®ÀÌ 2³â ¿¬¼ÓÀ¸·Î äÅõƴٴ °ÍÀº µô¸®¼Å½ºÀÇ ³ôÀº AI ±â¼ú·ÂÀ» Áõ¸íÇÑ °Í¡±À̶ó¸ç ¡°ÅؽºÆ® ȤÀº À̹ÌÁö, À¯»ç À̹ÌÁö µîÀ¸·Î °Ë»öÇßÀ» ¶§ »ç¿ëÀÚ°¡ ¿øÇÏ´Â °á°ú °ªÀÌ ºü¸£°í Á¤È®ÇÏ°Ô ³ª¿À´Â µ¥ À̹ø ¿¬±¸ °á°ú°¡ ±â¿©ÇÒ ¼ö ÀÖÀ» °ÍÀ¸·Î º»´Ù¡±°í ¸»Çß´Ù.

SOTA (State of the Art), Áï ±âÁ¸ ¿¬±¸µé°ú ºñ±³ÇØ °¡Àå ¶Ù¾î³­ ¼º´ÉÀ» ´Þ¼ºÇÑ AI ±â¼ú·ÂÀ» º¸À¯ÇÑ µô¸®¼Å½º´Â ÆÐ¼Ç µµ¼Ò¸Å °Å·¡ 1À§ Ç÷§Æû ¡®½Å»ó¸¶ÄÏ¡¯À» ¿î¿µ ÁßÀÌ´Ù. ½Å»ó¸¶ÄÏÀº 2022³âºÎÅÍ ÀϺ» ¹× Áß±¹À» ½ÃÀÛÀ¸·Î ÇØ¿Ü ÁøÃâÀ» º»°ÝÀûÀ¸·Î ÃßÁøÇØ KÆмÇÀÇ ±Û·Î¹úÈ­¸¦ ÁÖµµÇÏ°í ÀÖ´Ù.