https://arxiv.org/abs/2412.03801
랭그래프 프레임웍으로
start node
tl agents들
end node
영어, 불어, 일어 번역기를 수행하는 도구들을 노드 형태로 묶어 intent agent를 구현하는 것으로 이해하였음.


데이터 플로우 차트는 이래되고,
실험평가에서 흔히 벤치마크로 불리는/ 내지는 자주 보던 BLUE 데이터셋을 쓴 것으로 보임(확실치는 않지만 GLUE 와 비슷한 데이터셋인 건가) ~ 무튼 공학계열에서는 객관적인 지표가 중요하여, 벤치마크를 꼭 하는 것 같음
내논문에서 application
- 비슷한 태스크의 데이터셋으로 벤치마크를 해서 결과를 비교해보자.
- 구체적 적용이라 함은) 현재 20퍼로 다 했을 때-> deepseekr1이 최대성능으로 추정됨-> deep 전체 추출셋 정답 비교-> 벤치마크로 성능 비교하기-> 논문내기: applied science
'2025-2학기 > 페이퍼 리뷰 및 수업, 자료' 카테고리의 다른 글
| 진로) 정출연 공동채용 3월, 9월 (0) | 2025.12.17 |
|---|---|
| [overleaf] bib tax과 참고문헌 순서 (1) | 2025.12.08 |
| 논문 초안, GPT 돌리지 말고 내가 써야지. (0) | 2025.11.19 |
| LLM 수업 내용과 나의 방향(은 어디루?) (0) | 2025.11.19 |
| 나란 연구자 (0) | 2025.11.13 |