통합검색
· 마을서비스란?  · 포럼마을  · 일반마을  · 테마마을  · 마을랭킹  · 활동왕
· 덱스퍼트란?  · TECBOX   · PRSBOX   · 이용안내  
· DEXT제품군  · 솔루션베이  · S/W & ESD 컴포넌트
· 프로그램베이
· LiveSeminar  · LiveConference
Visual C++ 포럼마을 입니다.
  마을등급 Visual C++   이 마을은 포럼마을 입니다이 마을은 자유가입제 마을 입니다 마을소개 페이지로 이동 전입신청
마을촌장촌장 나성훈 주민 1573 since 2006-12-29
우리마을 공지사항
질문&답변
강좌&팁
자유게시판
자료실
앨범
개인게시판
마을 게시판
등록된 마을 게시판이
없습니다.
랑데브 게시판
칼럼 게시판
개발자 고충상담
Dev Talk
자유토론방
벼룩시장
재나미 우스개
구인/프로젝트 정보
사람인 채용 게시판
  고객지원 게시판
마이 데브피아
 나의 e-Money 내역
 활동왕 My Page
 스크랩한 게시글보기
 쪽지관리
 주소록관리

 자료실
 문장기반으로 한글을 영어로 영어를 한글로 통역해주는 통역프로그램  | VC++ 일반 2016-04-08 오후 9:09:57
 aerojin1  aerojin1님께 메시지 보내기aerojin1님을 내 주소록에 추가합니다.aerojin1님의 개인게시판 가기 번호: 32367 추천:0  / 읽음:3,471

 

c++로 만든 문장 통역기입니다.

 

알파고 같은 신경망으로는 영원히 해결 불가능할수 있는 자동통역분야를 거의 10년이상 연구한 결과물입니다.

 

중심언어를 한국어로 잡아서 개발 중인데 완성된것은 아닙니다.

 

지금은 영한영 부분에서만 이루어 지고 있습니다.

 

언어를 롹장할수 있는 형태인데 다른언어로 확장하고 싶으신 분은 연락 주시면 데이터를 추가할수 있고

 

디버깅이 가능한 버전을 드리겠습니다.

 

아직은 미약하지만 가능성에 많은 관심을 가져 주십시요.

 

-감사합니다-

 

문의메일 sanghun5923@daum.net

 

[코멘트] 좋음
2016-04-09 23:19
 leesa49  leesa49님께 메시지 보내기leesa49님을 내 주소록에 추가합니다.leesa49님의 개인게시판 가기 
번역기?!
저장 취소
[코멘트] 좋음
2016-04-10 14:57
 aerojin1  aerojin1님께 메시지 보내기aerojin1님을 내 주소록에 추가합니다.aerojin1님의 개인게시판 가기 
번역기로 알고 있는 분들이 많은데 그럴수도 있겠구나 생각이 들어서
이것이 기존의 번역기와 다른 부분을 설명할까 합니다.

기존의 번역기들은 번역률에서 만족할수가 없는게 현실입니다.
그래서 사용하는데 제약을 많이 받습니다.
100% 신뢰할수 없다면 쓰임새도 한정이 되겠지요.

이 문장통역기는 태생부터 100%번역되는 문장만을 만들수 있게 되어 있습니다.
그래서 인터페이스적으로도 번역기와는 다른 구조를 가지고 있습니다.

내부적인 데이터로 구성된 문장만 만들수 있어서 그 외의 잘못된 문장은 나올수가 없습니다.

번역기와는 다르게 생성 문장의 모호성을 없애고 정확성을 높이기 위해서
표현을 표준화 했습니다.

이것으로 의사소통이나 매뉴얼 제작, 웹페이지를 만드는데 쓰일수 있습니다.
뉴스까지 가능하게 만드는 것이 목표입니다.

영어나 중국어등 외국어에 아주 탁월하고 잘 아는 전문가를 대신하지는 못하지만
웹페이지를 여러언어로 만들거나 어떤 제품의 다중 매뉴얼을 만든다거나
사업적인 업무로 실시간으로 의사소통을 해야 할때 사용할수 있도록 만들려고 합니다

100% 완전한 문장만 생성할수 있다는 것이 번역기와는 다른 점입니다.

그리고 조합적 폭발이라는 언어의 특성을 활용해서 아주 많은 표현문장을 담아 낸것이 특징입니다.

현재 10의 122승개 정도의 영한영 문장을 생성할수 있습니다.

정확히는 194,185,618,057,270,941,259,266,687,286,812,150,399,058,222,266,907,090,963,540,668,086,044,414,476,
680,590,439,380,994,282,552,974,099,026,207,296,978,973,115,644 개입니다
저장 취소
[코멘트] 좋음
2016-04-11 09:26
 smartboy  smartboy님께 메시지 보내기smartboy님을 내 주소록에 추가합니다.smartboy님의 개인게시판 가기 
정말 어려운 분야를 도전 하시었습니다.
번역은 언어론 까지 해야 해서 상상을 초월하는 난해한 문제들이 많습니다.
예를 들어 싸움 발생의 원인은 대부분 언어로 표현이 부정확하거나 적절하지 않기 때문입니다.
또는 시비 꺼리나 꼬투리의 대상이 되지요...
언어론을 한다는 것은 이러한 많은 문제들에 대한 근본적이고 분석적인 해결 방법을 학문으로 다룹니다.
어찌되었건, 흥미롭고, 재미는 있지만, 시간이 소요되고 돈은 않되는 일 이지요.
저장 취소
[코멘트] 좋음
2016-04-18 00:09
 dae9dae9  dae9dae9님께 메시지 보내기dae9dae9님을 내 주소록에 추가합니다.dae9dae9님의 개인게시판 가기 
많은 시간과 노력이 들어간 결과물이로군요

더 다듬어서 번역의 정확도를 높이고, 입력 문장도 완전한 문장이 아니더라도 될 수 있게 해서

구글에서 하는 번역 서비스에 도입을 제안을 해보면 어떨지요?

https://translate.google.com/
저장 취소
[코멘트] 좋음
2016-04-18 16:58
 aerojin1  aerojin1님께 메시지 보내기aerojin1님을 내 주소록에 추가합니다.aerojin1님의 개인게시판 가기 
관심을 가져주셔서 감사합니다.

현재 여러군데에 접촉은 하고 있는데 여의치가 않습니다.
기존회사에서는 자신들의 서비스와 공통적인 부분이라면 관심을 갖지않는것 같습니다.
물론 제가 더 노력해야겠지만 현재로서는 기존의 제품과 다른점을 어필하는데 어려움이 많네요.

통역이라는 것이 단순한 서비스일수 있지만 거기에서 창출되는 수익은 현재의 인공지능시장을 모두 합친것 이상으로 보입니다.

유럽연합의 번역시스템 구축의 예산편성에 90년대에 1조원 이상이 들어간걸로 알고 있습니다.

국가 보다는 개인간이나 기업간의 소통을 신뢰성있게 가져갈수 있게 만든다면 많은 수익 모델이 있을겁니다.

구글이나 페이스북도 어떻게 보면 검색엔진과 커뮤니티라는 바탕위에서 광고로서 수익을 올린다고 할수 있습니다.
(물론 지금은 다른 사업도 많이 하지만 기본적인 토대는 이것으로 보입니다)

문장통역기는 기본적인 수익모델이 개인간의 소통위에서 자동으로 맞춤형 광고를 할수 있습니다.
그게 가능한게 기계가 분석할수 있는 문장만을 사용하기 때문입니다.

어쨌든 지금 많은 분야에 걸쳐서 다각도로 접촉은 하고 있습니다.

많은 분들의 뒷받침으로 사업화의 방향을 찾도록 노력하겠습니다.

앞으로도 많이 관심 가져주시고 응원해 주십시요.
저장 취소
[코멘트] 좋음
2016-04-23 23:01
 win3200  win3200님께 메시지 보내기win3200님을 내 주소록에 추가합니다.win3200님의 개인게시판 가기 
번역 수준은 어느정도인가요?
저장 취소
[코멘트] 좋음
2016-04-24 15:47
 aerojin1  aerojin1님께 메시지 보내기aerojin1님을 내 주소록에 추가합니다.aerojin1님의 개인게시판 가기 
결론적으로 번역 수준은 아직 별로고 가능성을 겨우 확인할수 있는 수준이라고 할수있습니다.

지금 문장의 범위가 영어는 100단어까지 한글은 80단어정도까지인데 10의 122승개 정도입니다.
기본단어가 1000개 내외에서 했으니까 실제로 나올수 있는 문장은 최대치가 10^3*100=10의 300승정도입니다.
기본단어를 백만개로 한다면 10의 600승입니다
여기에서 지금도 계산하고 있는것이 필요없는 부분을 뻰 실제로 가능한 문장수가 얼마인가인데
그것을 알아낸다면 정확한 범위 계산이 될겁니다.

문법적으로는 평문장의 3형식까지 의문문이나 명령문은 기본적인 것만 있고
and나 or로 연결되는것은 두개의 연속조합만 됩니다.

예를들면 '나는 나의 친구와 나의 어머니를 좋아해요'라는 문장은 만들수 있지만
'나는 나의 친구와 나의 어머니와 그녀의 아버지를 좋아해요'는 문장은 만들수가 없습니다.
이경우는 일상적인 대화에서 여러개를 나열하는게 필요하면 문장을 둘로 나누어서 만들수 있어서 제한했습니다.
문장의 연결도 두개로 제한했습니다.

문의하신게 전체적인 쓰임새나 실용성을 말씀하시는것 같은데
지금으로서는 간단하게 대화할수 있는 수준입니다.
머리속에 떠오르는 단어를 그대로 조합하기가 용이하지 않고 대체되는 나올수 있는 문장을 찾아야 합니다.
표현방식도 ~해요, ~하나요, ~하세요 등으로 제한되어 있고요

지금 데이터를 추가하고 있는데 많은 데이터가 들어가고 존칭표현이 들어가게 할겁니다.
저장 취소
[코멘트] 좋음
2016-04-24 16:13
 aerojin1  aerojin1님께 메시지 보내기aerojin1님을 내 주소록에 추가합니다.aerojin1님의 개인게시판 가기 
덧붙이자면..
중심언어를 한국어로 잡고 데이터를 만들고 있습니다.
제가 한국어를 제일 잘하니까 그런것도 있지만 근본적으로는 다른 언어에 비해서 한국어가 매우 탄력적입니다.

한국어는 3000년 이상을 어순과 계열이 다른 중국어에 영향을 받으면서 변화에 대한 대응이 발달된것 같습니다.
아시다시피 중국어는 영어와 같은 어순체계입니다.

일본어나 몽골어, 터키어는 우리와 어순이 비슷하고 특히 일본어는 중국어나 인도어의 방언의 변화보다도 더 적은
한국어의 사투리 같은 형태로 아주 비슷합니다.

영어의 문장들을 분석한 보고서를 보면 기본 2000단어가 문장의 90%이상을 차지한다고 합니다.
우리가 중학교에서 배우는 단어가 3000개 내외이고 고등학교까지 6000개정도의 단어를 배우는게
이런 이유 같습니다.
(앞서 말한 글안의 기본단어는 영어를 기준으로 말씀드린겁니다.)

한국어로 가정하면 기본단어가 20000개 정도입니다.
토씨때문에 10배정도 많은데 하나의 명사라도 주어일때나 목적어일때, 보어일때 토씨가 붙어서
이렇게 기본단어가 많아집니다.
이것은 데이터 만드는데는 단점일수도 있는데 통역기를 만드는 입장에서는 아주 커다란 장점입니다.

문장성분을 단어별로 명확히 분류할수 있어서 아주 좋습니다.
영어나 중국어로 위치에 따라서 의미가 바뀌는 것을 처리하자면 한가지 처리가 더 들어가야 하니까요
이것이 중국어의 영향아래에서 몇천년을 버티면서 발달한 부분이 아닌가 여겨집니다.

지금 한국어와 영어의 데이터를 구축하고 있습니다.
이것을 기반으로 해서 다른언어에 적용한다면 아주 빠르게 진행될것으로 보입니다.
데이터의 기반이 이것으로 마련이 되는 거니까요.

한국어가 중심이고 이것으로 영어나, 중국어, 아랍어, 스페인어등을 만든다는 것은
예를들어 영어에서 스페인어나 중국어로 통역하는데 한국어를 거친다는 겁니다.
모든언어끼리 소통하는데 한국어가 중심이 되는 겁니다.

이런 좋은 시스템으로 영어도 잘 못하는 제가 데이터를 만드는데 어려움이 많이 있습니다.
데이터 추가에 도움을 주실 분들의 연락을 기다립니다.
sanghun5923@daum.net 으로 메일을 보내주십시요

-감사합니다-
저장 취소
코멘트쓰기
  좋음   놀람   궁금   화남   슬픔   최고   침묵   시무룩   부끄럼   난감
* 코멘트는 500자 이내(띄어쓰기 포함)로 적어주세요.
목록 보기   지금 보고 계시는 글을 회원님의 my Mblog >> 스크랩에 넣어두고 다음에 바로 보실 수 있습니다.  
회사소개  |   개인정보취급방침  |  제휴문의  |   광고문의  |   E-Mail 무단수집거부  |   고객지원  |   이용안내  |   세금계산서
사업자등록번호 안내: 220-81-90008 / 통신판매업신고번호 제 2017-서울구로-0055호 / 대표: 홍영준, 서민호
08390, 서울시 구로구 디지털로32길 30, 1211호 / TEL. 02_6719_6200 / FAX. 02-6499-1910
Copyright ⓒ (주) 데브피아. All rights reserved.