[1015]모두에게 전하는 모두연 AI뉴스!

  • IMAGINE: AI의 상상력이 밝히는 상식 추론의 새로운 지평

이 논문은 텍스트 기반 상식 추론 모델의 일반화 능력을 향상시키기 위해 머신 상상력을 활용하는 새로운 제로샷 상식 추론 프레임워크인 IMAGINE을 제안합니다. IMAGINE은 텍스트 입력을 보완하기 위해 머신 생성 이미지에서 파생된 시각적 신호를 활용합니다. 이를 위해 사전 훈련된 언어 모델(PLM)에 이미지 생성기를 통합하여 머신 상상력을 부여합니다. 또한, 시각적 질문 답변을 시뮬레이션하는 합성 VQA 데이터 세트를 생성하여 PLM이 머신 상상력을 효과적으로 활용하도록 학습시킵니다. 다양한 추론 벤치마크에 대한 실험 결과는 IMAGINE이 기존 방법보다 성능이 뛰어나다는 것을 보여줍니다. 이는 머신 상상력이 보고 편향을 완화하고 일반화 능력을 향상시키는 데 효과적임을 시사합니다.


https://arxiv.org/abs/2410.09329


  • LLM, 다중 턴 공격에 취약! ActorAttack의 치명적인 공격 경로

이 논문은 대규모 언어 모델(LLM)의 다중 턴 대화에서의 안전 취약성을 노출하는 새로운 공격 방법인 ActorAttack을 제안합니다. ActorAttack은 악의적인 사용자가 여러 쿼리에 걸쳐 유해한 의도를 숨길 수 있는 상황을 공략합니다. 이 방법은 행위자-네트워크 이론에서 영감을 받아 의미적으로 연결된 행위자 네트워크를 공격 단서로 모델링하여 유해한 목표를 향한 다양하고 효과적인 공격 경로를 생성합니다. ActorAttack은 다중 턴 공격의 두 가지 주요 과제, 즉 유해한 의도를 숨기고 동일한 유해한 목표를 향한 다양한 공격 경로를 찾는 것을 해결합니다. 이를 위해 ActorAttack은 LLM의 지식을 활용하여 공격 단서를 자동으로 찾고, 공격 체인을 추론하여 단계별 공격 경로를 생성합니다. 실험 결과는 ActorAttack이 기존의 단일 턴 및 다중 턴 공격 방법보다 성능이 뛰어나며, 고급 정렬 LLM에서도 효과적임을 보여줍니다. 또한, ActorAttack에서 생성된 다중 턴 적대적 프롬프트와 안전 정렬 데이터를 포함하는 SafeMTData라는 데이터 세트를 공개합니다. 이 데이터 세트를 사용하여 안전 미세 조정된 모델은 다중 턴 공격에 더 강력합니다.


https://arxiv.org/abs/2410.10700


[마감임박!] AI개발자 과정! 입문자에서 전공자까지! AI학교 아이펠 10기 합류 : https://bit.ly/3Y0ZO7Q

Zero-shot Commonsense Reasoning over Machine Imagination

arXiv.org

Zero-shot Commonsense Reasoning over Machine Imagination

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 10월 15일 오전 8:20

댓글 0

    함께 읽은 게시물

    🚀 [2025 셀프 호스팅 가이드]

    ... 더 보기

    selfh.st - Self-hosted content and software

    selfh.st

    selfh.st - Self-hosted content and software

     • 

    저장 47 • 조회 1,398


    <🇺🇸 미국 취업 루트?> 미국, 캐나다 근무했던 경험을 바탕으로 취업 루트 몇 가지 알려드립니다 (현재는 미국 정착). 이 포스팅은 몇 가지 옵션을 간단하게 소개하기 위해 공유합니다. 이민 전문 변호사가 아니기 때문에 자세한 정보는 변호사와 상담해보세요. 1️⃣ 미국 대학 졸업 + OPT/OPT STEM EAD 수령 미국 정부에서 인정하는 4년제 대학을 졸업하면 취업할 수 있는 OPT 프로그램을 제공합니다. OPT는 비자가 아니며 취업 권한을 가질 수 있는 프로그램입니다. 문과는 대게 1년이며 이과는 1+2, 총 3년입니다. 문제는 OPT의 경우 기간이 짧고 이 기간 내에 영주권 수령이 거의 불가능하기 때문에 추후 미국 6년짜리 취업 비자인 H1B 스폰서십을 받아야 합니다. OPT는 회사가 스폰서 하는 프로그램이 아니라 학교에서 제공하는 프로그램이라서 이직이 비교적 자유롭고, 해고당하더라도 취업 권한이 사라지지 않고 다른 회사에 다시 취업할 수 있습니다. 굳이 미국 대학이 아니라도 2년 대학원 유학을 통해 OPT/OPT STEM 자격을 얻어서 취업하는 경우도 많습니다. 2️⃣ H1B 회사가 스폰해주는 미국 취업 비자입니다. 총기간은 6년이지만 3년마자 재 신청해서 총 6년까지 받을 수 있습니다. 한국에서 대학을 나오더라도 미국 회사 인터뷰 통과 후 스폰만 해준다면 지원할 수 있습니다. 굳이 미국 대학을 나오지 않아도 됩니다. 문제는 H1B 수령은 하늘의 별따기만큼 어렵습니다. 로또처럼 무작위로 정해진 숫자만큼 뽑는데, 지원자는 3배 이상 많아서 성공률이 33% 이내로 적습니다. 3️⃣ 외국계 취업 후 L1비자로 미국 본사로 이직 캐나다 있을 때 가장 많이 본 케이스입니다. 미국 회사의 외국 지사에 1년 근무하면 L1비자를 스폰받을 수 있습니다. L1수령 후 미국 본사에서 근무 가능합니다. 물론 회사에서 해줘야지만 받을 수 있는 비자이지만 L1은 H1B처럼 정해진 숫자가 있는 게 아니라 서류와 인터뷰 심사만 잘하면 받을 수 있습니다. 코로나 이전에는 3개월에서 6개월이면 수령할 수 있어서 주변의 많은 지인들이 캐나다에서 미국으로 이직했었습니다. 단점이라면 L1은 회사에서 해고당하는 날 바로 한국으로 귀국해야 합니다. L1 기간 중 회사에서 영주권을 스폰해주면 다행이지만, 안 해주고 해고당하면 언제든지 나갈 준비를 해야 하... 더 보기

    ChatGPT 런칭시, 5일만에 백만명의 사용자가 등록하면서 역사상 가장 빠르게 1백만 사용자를 획득한 서비스가 되었었는데요.


    그런데 이번 이미지 생성 모델 출시 후 인터넷이 지브리피케이션되면서, 한시간만에 백만명의 사용자를 획득했다고 합니다.


    생산성이고 뭐고, 역시 재미난게 짱짱맨이네요.

    조회 2,072


    데이터 이야기 #6: 기본 데이터 직군 - 데이터 엔지니어

    앞서 포스팅에서는 기본 데이터 직군이라 할 수 있는 데이터 엔지니어, 데이터 분석가, 데이터 과학자 중 먼저 데이터 분석가와 데이터 과학자에 대해서 이야기해보았다. 이번 포스팅에서는 데이터 엔지니어에 대해 이야기해보고자 한다.

    ... 더 보기

     • 

    저장 17 • 조회 3,648


    각종 스토리지를 통해 알아 보는 분산 시스템 개념

    1️⃣ Apache Cassandra - 파티션 기반의 Wide Column 저장소 모델을 활용 - multi-master data replication - 높은 가용성(availability)과 low latency를 제공함 - 단일 장애 지점(single point of failure)이 없음 - 궁극적 일관성(eventual consistent) 데이터베이스 - 모든 업데이트는 궁극적으로 레플리카 노드에 도달함 - 궁극적 일관성으로 인해 임시적으로 노드마다 데이터가 다를 수 있음 - Consistent Hashing으로 데... 더 보기

    Fundamentals of Distributed Systems | Baeldung on Computer Science

    Baeldung

    Fundamentals of Distributed Systems | Baeldung on Computer Science

     • 

    저장 72 • 조회 5,887


    데이터 분석 자격증 Top 9(+5)

    ... 더 보기

    The top 9 data analytics certifications

    CIO

    The top 9 data analytics certifications

     • 

    저장 20 • 조회 2,133