문법 검사 시스템 및 방법과 이를 위한 컴퓨터 프로그램(SYSTEM AND METHOD FOR CHECKING GRAMMAR AND COMPUTER PROGRAM FOR THE SAME) > 판매

본문 바로가기

문법 검사 시스템 및 방법과 이를 위한 컴퓨터 프로그램(SYSTEM AND METHOD FOR CHECKING GRAMMAR …

등록번호 특허 제10-2182248호

분야 특허

분류 정보통신

판매가 2200000000

판매자 정승택 / 010-2548-9955 / kangjust@gmail.com

본문

【 특허기술 활용 분야 】 

1. 의미 기반의 국문법 검사

- 오탈자, 띄어쓰기 자동 변환 가능 (정승택님/정승택 님, 정 씨, 정승택 씨, 정씨 가문, 정씨 부인 )

- 명사 등은 물론, 어간과 어미에 대한 오류 수정 가능

- 한자 오류, 동음이의어/유사어 처리가 가능

(든지/던지, 결재/결제, 개발/계발, 보전/보존, 맞추다/맞히다 - - - )

2. 용언의 규칙/비규칙 활용 종류 파악 가능

3. 품사를 명확하게 규명 (향후 자연어 처리에 활용 가능)

4. 문법적 오류 검토 및 처리가 가능

- 어색하거나 틀린 문장 수정 가능

- 한자, 일본식 용어 등 어려운 단어, 표현 등을 쉬운 단어 및 문장으로 변환

- 문법적 판단 가능(ᄂ지/ᄂ 지, ᄅ+의존명사, (모음,ᄂ)+율, !(모음,ᄂ)+률, 유/무성음)

5. 오탈자, 오류 등에 대한 정확한 도움말 제공 가능

6. 단순 오탈자, 띄어쓰기, 문장 표현 및 문법 검사,

- G-mail, MS Word, HWP, 공문서 등에 대한 문법 검사

- 초·중·고, 대학교 등의 교과서 및 문제집 등에 대한 문법 검사

- 신문 및 잡지 등 언론사의 기사 등에 대한 문법 검사

7. TV 자막 자동 텍스트 입력 및 문법 검사

※ STT에서 음성을 텍스트 변환시 텍스트 정확성 검사 및 변환

8. 사투리를 표준어로, 표준어를 특정 지역 사투리로 변환

9. 외국어 문법 검사로 기능 확대 가능 (영어, 중국어, 스페인어, 일본어 등)

10. 의미 분석 기반의 데이터 검색에 활용 가능

- 체언 중심의 검색 방식에서 체언+용언 중심으로 변환 가능

11. 법령문장 등에 대한 형태소 분석기 성능 개선에 활용 가능

- 한국어의 의미 분석툴로 확장 가능


I. 적용할 문법규칙에 따라 품사를 상세하게 재분류한 단어의미사전 DB 구축

○ 단어들이 동일한 품사라도 의미에 따라 적용하는 문법규칙이 서로 다르므로,

- 문법규칙이 서로 같은 단어끼리 그룹핑하는 방법으로 모든 단어를 품사별로 상세하게 재분류한다.

- 단어별로 오탈자, 띄어쓰기 정보, 조사 파생어, 유사어처리함수명, 문장표현처리함수명 등을 등록한다

- 품사 상세종류별(그룹)로 프로토콜을 이용하여 각각의 해당 문법규칙을 기술한다.

- 문법규칙과 관련된 도움말을 단어별 또는 품사 상세종류별로 등록한다.

○ 이를 통해, 컴퓨터가 단어의 종류 및 문법규칙을 이해하고 처리할 수 있는 단어의미사전을 구축한다

○ 동일한 단어일지라도 앞에 오는 단어에 따라 띄어 쓰거도 하고, 붙여 쓰기도 하는 경우가 많다.

예) 지방 단체^간, 3년간, 이틀간 등은 명사와 한자 ‘간(間)’이 만나는 경우로, 띄어쓰는 것이 원칙이나

시간 및 기간을 나타내는 단어와 만날 때는 붙여 써야 한다. 그러나, 컴퓨터는 ‘단체’나 ‘이틀’이라는 단어가

어떤 종류의 단어인지를 알 수가 문법규칙을 처리할 수 없다.

예) 각각의 단어가 어떤 의미의 단어인지를 상세분류하여 컴퓨터가 인식하도록 지원함으로써

문법규칙을 이해하고 처리할 수 있게 된다.

단체: (체언 – 명사) ▶ (체언 – 명사 – 조직과건물 – 기관단체회사),

이틀: (체언 – 명사) ▶ (체언 – 명사 – 시간 – 동안시대)


II. 용언의 어간 확장 및 DB 구축

(단일어의 확장 어간을 제작하고, 이를 기반으로 결합어/합성어에 대한 확장 어간 제작하여 단어의미사전에 등록)

○ 동사, 형용사 등 용언은 단어사전에 등록되어 있으나, 실제 활용하는 형태가 아니므로, 단어사전에 등록되어 있지 않고,

문법규칙을 적용하기가 어렵다.

☞ 문장에서 문법규칙을 적용 및 교정하기 위해서는 문장에서 실제 활용하면서

용언의 어간에 어미가 붙는 방법(문법규칙)에 따라 어간을 확장하여야 한다.

※ 동사 ‘만들다’의 어간은 ‘만들’이다. 확장된 어간으로 기본형(만들), 불규칙형(만드, 만드시), 진행형(만드는, 만드시는),

현재형(만든, 만드신), 연결형(만들어, 만드셔), 과거형(만들었, 만드셨), 미래형(만들, 만드실), 종료형(만듭, 만드십)

명사형(만듦, 만드심) 등을 생성한다.

※ 동일한 어미라고 하여도 어간의 형태에 문법적 성격이 다르다. 예를 들어, 어미 “요"는 기본형에는 붙일 수 없고

연결형에만 붙일 수 있다.

예를 들어, 기본형 ‘되’ 에는 ‘요’를 붙일 수 없어, ‘되+요’/’좋아하+요’는 문법적인 오류이고.

연결형 ‘돼, ‘되어’에는 ‘요’를 붙일 수 있어, ‘돼+요’/’되어+요’/’좋아해+요’는 문법적으로 맞는 표현이다.

○ 모든 용언을 한꺼번에 확장하기에는 용언의 개수가 너무 많다. 이러한 문제점을 해결하기 위해 단일어의

어간을 확장하고, 단일어의 확장 어간을 이용하여 결합어, 합성어 등의 어간을 확장한다.


III. 전문가의 문법지식을 컴퓨터에게 전달하기 위한 프로토콜 정의 및 문법규칙 표현

○ ‘프로토콜’이란 컴퓨터에게 단어의 의미를 이해하도록 지원하거나, 사람이 알고 있는 전문지식을

컴퓨터가 이해하고 처리할 수 있는 형태로 변환하는 등 사람과 컴퓨터가 서로 소통하기 위한 표현 방법을 말한다.

○ 컴퓨터가 맞춤법 검사를 위해서 단어의미사전으로부터 단어에 대한 품사의 상세종류(의미)를 파악하거나

전문가의 문법지식을 컴퓨터가 이해 및 처리할 수 있는 형태로 표현하기 위한 기호, 규칙, 함수 등을 정의한다.


IV 오탈자 제작 및 활용 방안

■ 유사 글자/단어를 이용한 오탈자 생성 및 단어별 저장

○ 오탈자가 발생할 수 있는 글자/단어별 오탈자 목록을 작성하고 이를 이용하여

표준 단어별 오탈자 자동 생성 및 저장

○ 단어

- 군/꾼, 성/형, 길/질, 기름/지름, 장이/쟁이, 둥이/동이/등이, 퉁이/통이, 숭이/송이, 걷어/거둬

- 스런/스러운. 털이/떨이떠리/터리, 듯시/드시, 들이/드리, 재미/자미, 걷어/거둬, 부치/붙이

○ 글자

- 개/걔/게/계, 패/퍠/페/폐, 래/럐/레/례, 매/메, 새/세, 내/네, 스르/슬르, 빗/빚/빛,

- 파/퍼, 빠/뻐, 프/푸, 쁘/뿌, 십/쉽, 쇼/소, 옹/웅, 충/총, 이/위, 기/귀, 틱틱/튀튀

- 이어/여, 시어/셔, 주어/줘, 보아/봐, 두어/둬, 되/돼, 엇/었, 엿/였

- ㄱ/ㄲ/ㅋ, ㄷ/ㄸ/ㅌ, ㅅ/ㅆ, ㅈ/ㅉ, ㅂ/ㅃㅍ/ㅎ, 에/예/애, 이/위, 왜/외, 방/박, 종성에서 리을(ㄹ) 탈락(걸르/거르),

- 활/할, 깍/깎, 겟/겠, 수/숫, 위/웃/윗

☞ 예) 초콜릿(chocolate)

- 초-촤-쵸, 코/커/컬/콜, 랫/럣/렛/롓/랱/럩/렡/롙/릿/맅/래트/럐트/레트/례트/리트

■ 사잇소리로 오탈자 생성 및 단어별 저장

○ 단어의미사전에 등록된 단어 중에서 두 단어가 합쳐진 단어이고, 앞 단어가 모음으로끝나는 경우에

두 단어 사이에 무조건 사잇소리를 넣어서 오탈자 자동 생성

○ 단어의미사전에 등록된 단어 중에서 두 단어가 합쳐진 단어이고, 앞 단어와 다음 단어 사이에

포함되어 있는 사잇소리를 제거하여 오탈자 자동 생성

☞ 예) 굴비-찌개(오탈자: 굴빗찌개), 김치-찌개(오탈자: 김칫찌개), 깍두기-찌개(오탈자: 깍두깃찌개)

꽁치-김치찌개(오탈자: 꽁칫김칫찌개), 꽃게-된장찌개(오탈자: 꽃게-된장찌개), 제삿날(오탈자: 제사날)

----------------------------------------------------------------------------

요약

문법 검사 시스템은, 복수 개의 단어 및 상기 복수 개의 단어 각각에 상응하는 속성정보를 포함하는 단어의미 사전 데이터베이스와, 상기 속성정보를 이용하여 정의된 처리 규칙 정보를 저장하도록 구성된 저장 모듈; 상기 단어의미사전 데이터베이스에 기초하여, 입력 데이터로부터 하나 이상의 문장을 추출하며, 추출된 하나 이상의 문장으로부터 하나 이상의 단어 또는 어절을 분리하도록 구성된 입력 모듈; 분리된 하나 이상의 단어 또는 어절에 대하여, 상기 속성정보를 이용하여 정의된 문법 처리 규칙을 적용함으로써 문법 오류를 탐지하도록 구성된 문법검사 모듈; 및 상기 문법 검사 모듈에 의해 탐지된 오류에 대한 정보를 제공하도록 구성된 출력 모듈을 포함한다. 이때, 상기 속성정보는, 단어의 성분을 나타내는 제1 속성, 단어의 품사를 나타내는 제2 속성, 및 단어의 의미성질구분을 나타내는 제3 속성을 포함하여 단계적으로 정의된다. 상기 문법 검사 시스템은, 적용되는 문법 규칙에 따라 품사를 상세하게 재분류한 단어의미사전 데이터베이스를 이용하여 정확한 문법 규칙을 적용할수 있으며, 각각의 문법 규칙을 소정의 프로토콜(protocol)에 의한 함수 형태로 표현함으로써 컴퓨터가 이를 인식하고 문법 검사를 처리하도록 할 수 있게 한 것이다.

 

영어설명서

Grammar check system, a semantic database of words containing multiple words and corresponding attribute information, and a storage module configured to store defined processing rule information using it extracts one or more sentences from the input data. Includes output modules. The above property information is defined step by step, including the first property representing the components of a word, the second property representing the parts of a word, and the third property representing the semantic property distinction of a word. The grammar check system allows the exact grammar rules to be applied using a dictionary database of words with detailed reclassification of parts according to the applicable grammar rules, and allows the computer to recognize each grammar rule in a functional form under a given protocol.

 

중국어설명서

语法检查系统是包含多个单词及上述多个单词各自对应的属性信息的单词的美字典数据库和利用上述属性信息来存储定义的处理规则信息的存储模块;基于上述单词的美字典数据库从输入数据中提取一个或多个句子中分离出一个或多个单词的输入模块;利用分离出的单词或词节来定义一个或多个单词的单词;利用以上一个或词句子的属性检查模块对以上一个以上单词或词条进行定义包括输出模块此时上述属性信息包括表示单词成分的第1属性表示单词词类的第2属性以及表示单词的含义性质分类的第3属性上述语法检查系统利用根据适用的语法规则详细再分类词类的单词的未词典数据库可以适用正确的语法规则通过根据所规定的协议(protocol)的函数形式表现各自的语法规则使计算机能够识别并处理语法检查

 

일본어설명서

文法検査システムは複数個単語及上記複数個単語それぞれに相応する属性情報単語意味辞書データベースと上記属性情報利用して定義された処理規則情報保存するように構成された保存モジュール;上記単語未査典データベースにづき入力データから以上文章抽出抽出された以上単語又語節分離するように構成された入力モジュール;分離された以上単語又語節について上記文法情報利用して定義された文法処理 出力モジュールをこのとき上記属性情報単語成分第一属性単語品詞第二属性および単語意味性質区分第三属性めて段階的定義される上記文法検査システムは適用される文法規則って品詞詳細再分類した単語未辞書データベースをいて正確文法規則適用することができそれぞれの文法規則所定のプロトコルによる関数形態表現することでコンピュータにこれを認識文法検査処理させることができるようにしたものである


75b44474904197f71ac50d82e0532b7b_1620882429_9019.png
75b44474904197f71ac50d82e0532b7b_1620882430_5511.png
75b44474904197f71ac50d82e0532b7b_1620882431_1947.png
75b44474904197f71ac50d82e0532b7b_1620882431_8423.png
75b44474904197f71ac50d82e0532b7b_1620882432_5116.png
 



기인사

서울시 강서구 곰달래로19가길 8-16 102호(화곡동) | Tel:010-9802-7791 | Fax:02-2603-4056

입금은행 ( 우리은행 1002-255-657436 신용기 )

사업자번호:527-23-00784 | 통신판매신고 제2015-서울강서-0808 | 대표자 : 신용기 | 개인정보담당자(yongki931@gmail.com)

Copyright © 기인사. All rights reserved.