PGR21.com
- 모두가 건전하게 즐길 수 있는 유머글을 올려주세요.
- 유게에서는 정치/종교 관련 등 논란성 글 및 개인 비방은 금지되어 있습니다.
Date 2023/08/01 11:13:46
Name Lord Be Goja
File #1 Screenshot_20230801_111220_Chrome.jpg (450.7 KB), Download : 88
File #2 Screenshot_20230801_111201_Chrome.jpg (102.4 KB), Download : 70
출처 기글하드웨아/ 영국의 한 대학 연구진
Link #2 https://gigglehd.com/gg/soft/14651716
Subject [기타] 가성비까지 좋은 언어




만들기도 쉬운데 팔곳까지 많다니 완전 사기!

하지만 그래서 국내기업의 국내시장파이를 외국계가 기존모델을 써서 대번에 뺏는건 힘들지도..

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
회색사과
23/08/01 11:18
수정 아이콘
말씀하신 대로 예전에는 언어의 장벽이 한국어 NLP 엔지니어들을 지켜줬었습니다만...

요새는 LLM이 영어에 대한 깊은 이해를 바탕으로 적은 자원의 외국어까지 섭렵하고 있습니다 ㅠㅠㅠ

얼마전에 학회 다녀왔더니 어떤 모델은 언어 2천개를 학습했다고 하더라구요..
문문문무
23/08/01 11:19
수정 아이콘
(수정됨) 그래서 그 추론능력을 활용하여 오픈AI에서 올해 5월쯤에 AI모델의 은닉층도 일종의 외국어로 인식하여 해독하려는 시도를 했더라고요
그 논문의 결과자체는 처참했지만 좀더 직관적으로 방법을 개선할여지가 많아보여서 상당히 가능성있다고 보고있고
오픈AI에서도 그렇게 느꼈는지 이후 6월? 7월?쯤에 초지능 정렬연구팀 공개모집할때 업무파트중 하나로 넣기도 했었습니다.
레드불
23/08/01 11:20
수정 아이콘
영어는 문법적으로 고립어라서 효율이 좋나보네요
사람되고싶다
23/08/01 11:24
수정 아이콘
근데 왜 전 영어를 못하죠 흑흑
지식은 있는데 체화가 안됨...
-안군-
23/08/01 11:25
수정 아이콘
우리는 GPT가 아니라서요. 흑흑
문문문무
23/08/01 11:27
수정 아이콘
뭐 어차피 2020년대 안으로 저런 비용논하는게 의미없어질정도로 저렴해질겁니다.
23/08/01 11:27
수정 아이콘
오늘도 영어에 스트레스를 받고 있습니다.
나만 영어 못해 ㅠ
23/08/01 11:30
수정 아이콘
AI도 영어하는데 나는 왜...
회색사과
23/08/01 11:33
수정 아이콘
여러분 AI 도 하는 영어 나는 왜 못하나 자책하지 마세요.

AI는 네이티브 영어 사용자입니다. (첫 언어가 영어..)

잘하는게 당연해요
오타니
23/08/01 11:34
수정 아이콘
한글이 최고 아닌가
망고베리
23/08/01 11:39
수정 아이콘
중국어도 효율이 좋겠네요. 문법도 단순하다니까
-안군-
23/08/01 11:41
수정 아이콘
실제로 좋습니다. 거의 글자단위로 끊으면 되는 수준이라..
-안군-
23/08/01 11:41
수정 아이콘
트랜스포머의 설계 자체가 영어에 특화돼있으니...
트랜스포머에 대한 설명을 처음 봤을때, 이건 한글에 쓰기엔 별로 안좋겠다는 느낌을 받긴 했어요. 그런데 그 구조를 다 뜯어고친 우리만의 무엇을 만들기엔 돈도, 시간도, 인력도 너무 부족하죠.
문문문무
23/08/01 11:43
수정 아이콘
당장 8월중으로 한국어 특화모델이라 선전하는 네이버의 하이퍼클로바가 나오긴합니다.
jjohny=쿠마
23/08/01 12:24
수정 아이콘
두근두근
밥과글
23/08/01 12:41
수정 아이콘
덕분에 18만원 하던 주식이 23만원..
덴드로븀
23/08/01 12:01
수정 아이콘
세종대왕님 어째서 한글을 만들때 AI 시대를 예상하지 못했던겁니까!
Lord Be Goja
23/08/01 12:05
수정 아이콘
크읔 나랏말씀을 듕귝과 같게 바꾸면 되는것을!
블레싱
23/08/01 12:11
수정 아이콘
한자쓰는 세계관 생각하면...
블래스트 도저
23/08/01 12:18
수정 아이콘
대왕님은 문자만 만드신...
한글 자체는 PC 시대에도 유용하죠 동아시아 문자치고 입력도 편하고
23/08/01 12:22
수정 아이콘
뭐야 가성비 좋은 연어 어디갔어 연어
abc초콜릿
23/08/01 13:00
수정 아이콘
궁금한 건 언어는 갈수록 단순해지는 경향을 가지는데 그러면 애초에 왜 라틴어나 고전 그리스어 같은 언어는 진작에 단순해지지 않고 그 시절엔 끝내주는 복잡한 문법을 가지고 있다가 나중에 그 언어를 쓰게 된 사람들이 갈라지면서 단순해진 걸까요
23/08/01 13:04
수정 아이콘
문자가 발명되고 글쓰는 기술이 발전하면서 굳이 문법적으로 세밀하게 언어를 구사할 필요성이 없어진 영향인 듯 하네요. 앞뒤 문맥으로도 충분히 뜻을 파악할 수 있으니 말이죠. 만약 문자가 없거나 작문이 시원찮은 시대라면 오해의 소지가 적도록 정밀하게 말을 해야 할 듯.
계층방정
23/08/01 13:14
수정 아이콘
문법이 복잡할수록 정보 손실에 강하죠. 영어를 예로 들어 I saw him whom... (읍읍!!)에서 말이 잘리면 그래도 어떤 행위의 대상이 되는 누군가를 보고 있었다는 걸 알 수 있는데, 현대에서처럼 whom 대신 who를 써서 I saw him who... (읍읍!!)에서 말이 잘리면 더 알 수 있는 게 없죠.
계층방정
23/08/01 13:25
수정 아이콘
Chatgpt에 물어보니 고전 언어들의 문법이 복잡한 이유로 여러 가지를 드네요.
1. 변화의 축적
2. 정교한 표현 추구
3. 지식인들의 언어 사용
4. 종교적, 의례적 사용
5. 기록할 자원이 부족(문법을 복잡하게 하는 대신 써야 할 분량은 줄어듦)
6. 표준화 X
7. 언어 쓰는 사람이 적음

반면 시간이 지나면서 표준화되고, 기록에 비해 구전 자료가 풍부해지고, 언어 사용자가 많아지고 여러 언어들이 섞이면서 문법이 단순해지는 경향을 띈다고 합니다.
계층방정
23/08/01 13:11
수정 아이콘
논문 요약에서는 여러 언어를 모두 공정하게 다루는 토큰화 모델이 필요하다고 결론을 맺고 있네요.

그리고 논문의 그림 3을 보면 토큰화 길이와 실행 시간 표가 나오는데 여러 가지 재미있는 결과들이 많습니다.

* 토큰화 길이가 제일 짧은 것은 영어고 실행 시간이 가장 적은 것은 말레이어(그리고 줄루어는 근소한 차이로 2등)로 나옵니다.
* 스페인어도 영어와 말레이어의 사이에 점이 찍히고, 그 외에도 서양 언어들의 성능이 전반적으로 좋습니다.
* 중국어는 의외라면 의외고 당연하다면 당연한 건데 번체가 간체보다 더 성능이 좋습니다.
* 가장 성능이 나쁜 건 미얀마 일부에서 쓰이는 언어인 샨어고, 그 외에도 종카어, 타밀어, 버마어도 상당히 부진합니다.
23/08/01 14:51
수정 아이콘
한국어도 한글로 표기할 때 모아쓰기 말고 풀어쓰기로 하면 좀 낫지 않을까요?
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
484050 [기타] 이번 초전도체의 이해 [47] 퍼블레인12134 23/08/01 12134
484048 [기타] 도대체 방금 무슨 일이 벌어졌는지 기술하시오. [22] 우주전쟁11570 23/08/01 11570
484047 [기타] 미국의 미슐랭 1스타 배달 오마카세 [9] Lord Be Goja10000 23/08/01 10000
484039 [기타] 현존하는 인류 유적 중 가장 오래된 유적 [16] Avicii10012 23/08/01 10012
484036 [기타] 자드 jpop 커버 [4] 라쇼6105 23/08/01 6105
484035 [기타] 이슈에 가장 민감한 것은 돈 [10] 껌정10457 23/08/01 10457
484034 [기타] 호불호 갈린다는 돈까스 [63] Avicii12229 23/08/01 12229
484033 [기타] 89년생 디씨인이 당했던 체벌 [61] Avicii11251 23/08/01 11251
484031 [기타] 폭염 때문에 문득 그리워지는 그 시절 장마 [18] 묻고 더블로 가!9772 23/08/01 9772
484028 [기타] 76세 히데오가 24세 히데오에게(하단 영상 포함) [4] KanQui#16876 23/08/01 6876
484025 [기타] 2차 가해가 더 무서운 이유 [2] 묻고 더블로 가!7344 23/08/01 7344
484014 [기타] 무엇으로 보이십니까? [28] 쎌라비10693 23/08/01 10693
484013 [기타] 36초 블랙박스 영상 거부한 판사 "볼 시간이 없다" [81] 로켓12229 23/08/01 12229
484011 [기타] (약후) 각종 이슈에 존재감은 없어졌지만 계속 생산되고 있는 AI [19] 묻고 더블로 가!10012 23/08/01 10012
484010 [기타] 오픈빨이 빠진 스레드를 구할 묘책은? [12] Lord Be Goja9038 23/08/01 9038
484009 [기타] 상온 초전도체 시뮬 성공한 버클리 연구소는 어떤 곳? [9] 우주전쟁10769 23/08/01 10769
483992 [기타] 상온 초전도체 설마 진짜??? [24] 우주전쟁12192 23/08/01 12192
483989 [기타] 싱글 1800->2200으로 오른 갤s24 with 스냅8gen3 [18] Lord Be Goja7836 23/08/01 7836
483983 [기타] X) 간판 교체란 참 힘든 일입니다. [11] 타카이7429 23/08/01 7429
483980 [기타] 가성비까지 좋은 언어 [27] Lord Be Goja11712 23/08/01 11712
483978 [기타] 출연진이 전원 사망한 영상물이 올라온 ott [11] Lord Be Goja11043 23/08/01 11043
483968 [기타] 6호 태풍 카눈 경로 급 변경.jpg [24] insane11506 23/08/01 11506
483963 [기타] 이번 상온초전도체에 대한 전체적인 스토리 [11] 한사영우12694 23/08/01 12694
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로