¼­¿ï´ë °ø´ë ÄÄÇ»ÅÍ°øÇкΠ±èÇö¿ì ¹Ú»ç, ±¹Á¦ ÃÖ¿ì¼ö AI ÇÐȸ EMNLP¿¡¼­ ±¹³» ´ëÇÐ ¿¬±¸ÀÚ ÃÖÃÊ ³í¹®»ó ¼ö»ó

  • ÁÖ¼Ò º¹»ç
  • ¹êµå °øÀ¯
  • ³×À̹ö °øÀ¯
  • Ä«Ä«¿ÀÅå °øÀ¯
  • ÆäÀ̽ººÏ °øÀ¯
  • Æ®À§ÅÍ °øÀ¯
¼­¿ï´ëÇб³ °ø°ú´ëÇÐ(ÇÐÀå È«À¯¼®)Àº ÄÄÇ»ÅÍ°øÇкΠ±èÇö¿ì ¹Ú»ç¿Í ±è°ÇÈñ ±³¼ö°¡ ¹Ì±¹ ½Ã¾ÖƲ ¾Ù·± ÀΰøÁö´É ¿¬±¸¼Ò(Allen Institute for AI, AI2) ¹× ¿ö½ÌÅÏ ´ëÇб³(University of Washington)ÀÇ ÃÖ¿¹Áø ±³¼ö µî°ú ÇÔ²² ÁøÇàÇÑ ¿¬±¸°¡ ±¹Á¦ ÃÖ¿ì¼ö ÀÚ¿¬¾îó¸® Çмú´ëȸ ¡®EMNLP 2023¡¯¿¡¼­ ¡®Outstanding Paper Award¡¯¸¦ ¼ö»óÇß´Ù°í ¹àÇû´Ù.

±¹³» ´ëÇÐ ¿¬±¸ÁøÀÌ EMNLP¿¡¼­ ¼ö»óÀ» ÇÑ °ÍÀº À̹øÀÌ ÃÖÃÊ´Ù.

±âÁ¸ ÀΰøÁö´É(AI) ´ëÈ­ ºÐ¾ß´Â °íÁúÀûÀ¸·Î µ¥ÀÌÅÍ ºÎÁ· ¹®Á¦¿¡ ½Ã´Þ·Á¿Ô´Ù. Àϻ󿡼­ ÀÌ·ïÁö´Â ´ëÈ­µéÀº µ¥ÀÌÅÍ·Î ±â·ÏµÇÁö ¾Ê´Â °æ¿ì°¡ ´ëºÎºÐÀ̱⠶§¹®ÀÌ´Ù. ¹®ÀÚ ¸Þ¼¼Áö³ª À̸ÞÀÏ °°Àº ÇüÅ·Π´ëÈ­°¡ ±â·ÏµÇ´õ¶óµµ ¿©·¯ ¹ýÀû Á¦¾àµéÀÌ Á¸ÀçÇϱ⠶§¹®¿¡ À̸¦ ¿¬±¸¿¡ È°¿ëÇϱ⿡´Â ¾î·Á¿ü´Ù.

ÀÌÀÇ ´ë¾ÈÀ¸·Î ±×µ¿¾È Å©¶ó¿ìµå ¼Ò½ÌÀ» ÅëÇØ ´ëÈ­ µ¥ÀÌÅͼÂÀ» Á¦ÀÛÇØ¿ÔÁö¸¸ ºñ¿ëµµ ¸¹ÀÌ µé°í, ¸¸µé ¼ö ÀÖ´Â µ¥ÀÌÅͼ ũ±âµµ ÀÛÀº ¹®Á¦Á¡ÀÌ ÀÖ´Ù. ±× °á°ú, ±âÁ¸ ´ëÈ­ °ü·Ã ¿¬±¸µéÀº ¸ðµÎ ¼Ò¼öÀÇ ÀÛÀº µ¥ÀÌÅͼ À§¿¡¼­ ÀÌ·ïÁ® ¹ü¿ë¼º¿¡ Å« Á¦¾àÀÌ ÀÖ¾ú´Ù.

¼ö»ó ³í¹®ÀÎ ¡®»çȸ »ó½Ä ¸Æ¶ôÈ­ ±â¹ýÀ» ÅëÇÑ ¹é¸¸ ´ÜÀ§ÀÇ ´ëÈ­ Áõ·ù(SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization)¡¯´Â À̸¦ ÇØ°áÇϱâ À§ÇØ °Å´ë ¾ð¾î¸ðµ¨(large language model, LLM)°ú ±âÈ£ ±â¹Ý »ó½Ä ±×·¡ÇÁ(symbolic commonsense knowledge graph)¸¦ ÇÔ²² »ç¿ëÇØ µ¥ÀÌÅͼÂÀ» È¿À²ÀûÀ¸·Î ÀÚµ¿ ±¸ÃàÇÏ´Â ¹æ¹ý·ÐÀÎ CO_3 Áõ·ù ÇÁ·¹ÀÓ¿öÅ©(distillation framework)¸¦ Á¦½ÃÇß´Ù.

±âÁ¸¿¡ Å©¶ó¿ìµå ¼Ò½Ì È°¿ë ½Ã¿¡´Â ´ëÈ­ Çϳª´ç ±æ°Ô´Â ¸î ºÐÀÌ °É¸®´ø ÀÛ¾÷À» 6ÃÊ ³»¿Ü·Î ´ÜÃà½ÃŲ´Ù. ¿¬±¸ÆÀÀº À̸¦ ÅëÇØ ¼¼°è ÃÖÃÊ·Î 150¸¸ ±Ô¸ðÀÇ ¼¼°è ÃÖ´ë °íÇ°Áú ÀÏ»ó ´ëÈ­ µ¥ÀÌÅͼÂÀÎ ¡®SODA¡¯¸¦ ¹«·á·Î °ø°³Çߴµ¥, ÀÌ´Â ±âÁ¸ µ¥ÀÌÅͼ ´ëºñ 100¹è Å« ±Ô¸ð´Ù.

ÀÌ ¹Û¿¡µµ ´ëÈ­ÀÇ ÀÚ¿¬½º·¯¿ò, ÀÏ°ü¼º, ±¸Ã¼¼º µî Ç°Áú ¶ÇÇÑ ±âÁ¸ Å©¶ó¿ìµå ¼Ò½Ì ±â¹Ý ´ëÈ­ µ¥ÀÌÅͼ¿¡ ºñÇØ 2¹è ÀÌ»ó ¶Ù¾î³­ °ÍÀ¸·Î ³ªÅ¸³µ´Ù. ±× °á°ú, SODA¿¡ ÇнÀ½ÃŲ 꺿 ¡®COSMO¡¯´Â ÆĶó¹ÌÅÍ ¼ö°¡ 30¾ï °³·Î ÀÛÀº Å©±âÀÓ¿¡µµ ºÒ±¸ÇÏ°í ±âÁ¸ Å« 꺿µé(ÆĶó¹ÌÅÍ ¼ö 70¾ï)º¸´Ù ´ëÈ­ ¸Æ¶ô¿¡ ´õ ÀûÇÕÇÏ°í ÀÚ¿¬½º·¯¿î ´äº¯ÀÌ °¡´ÉÇÏ´Ù.

À̹ø ¿¬±¸´Â ´ëÈ­ µ¥ÀÌÅͼ ºÎÁ· ¹®Á¦¸¦ ÇØ°áÇÏ°í, ´©±¸³ª °£ÆíÇÏ°Ô ¼¼°è ÃÖ´ë ±Ô¸ðÀÇ °íÇ°Áú ´ëÈ­ µ¥ÀÌÅͼÂÀ» ±¸ÃàÇÒ ¼ö ÀÖ´Â ¹æ¹ý·ÐÀ» Á¦½ÃÇß´Ù´Â µ¥¿¡ ÀÇÀÇ°¡ ÀÖ´Ù. ÀÌ ¹æ¹ý·ÐÀ¸·Î ź»ýÇÑ µ¥ÀÌÅͼ SODA´Â ´Ù¾çÇÑ ´ëÈ­ ¿¬±¸¿¡ ±â¹Ý ÀÚ·á·Î ¾²ÀÏ ¼ö ÀÖÀ» °ÍÀ¸·Î ±â´ëµÇ¸ç, ÇØ´ç ÄÚµå¿Í SODA µ¥ÀÌÅͼÂ, COSMO ¸ðµ¨Àº ¸ðµÎ ¿ÀǼҽº·Î °ø°³µÅ ÀÖ´Ù.

ÇØ´ç ³í¹®Àº ±èÇö¿ì ¹Ú»ç°¡ ¼­¿ï´ë ¹Ú»ç°úÁ¤ Áß ¹Ì±¹ ½Ã¾ÖƲÀÇ ¾Ù·± ÀΰøÁö´É ¿¬±¸¼Ò(Allen Institute for AI, AI2)¿¡¼­ ÀÎÅÏÀ» ¼öÇàÇÏ¸ç ¿ö½ÌÅÏ ´ëÇб³(University of Washington), Ä«³×±â¸á·Ð ´ëÇб³(Carnegie Mellon University), ¼­´ø Ķ¸®Æ÷´Ï¾Æ ´ëÇб³(University of Southern California), ±×¸®°í ÇÇÃ÷¹ö±× ´ëÇб³(University of Pittsburgh)°¡ ÇÔ²²ÇÏ´Â ±¹Á¦ °øµ¿Çù·Â ¿¬±¸¸¦ À̲ö °á°ú¸ç, ±èÇö¿ì ¹Ú»ç´Â Á¹¾÷ ÈÄ AI2¿¡¼­ ¹Ú»çÈÄ ¿¬±¸¿øÀ¸·Î Ãë¾÷ÇØ ÈÄ¼Ó ¿¬±¸¸¦ À̾´Â ÁßÀÌ´Ù.

±èÇö¿ì ¹Ú»ç¿Í ±è°ÇÈñ ±³¼ö´Â Á¤º¸Åë½Å±âȹÆò°¡¿ø(IITP)ÀÇ ¿¬±¸ºñ¸¦ Áö¿ø¹Þ¾Ò´Ù.(No.2019-0-01082, No.2022-0-00156)

¡Ø ³í¹® ¸µÅ©: https://aclanthology.org/2023.emnlp-main.799
¡Ø ÄÚµå ¸µÅ©: https://hyunw.kim/sodaverse