KR20200053341A - Vehicle and controlling method thereof - Google Patents

Vehicle and controlling method thereof Download PDF

Info

Publication number
KR20200053341A
KR20200053341A KR1020180136845A KR20180136845A KR20200053341A KR 20200053341 A KR20200053341 A KR 20200053341A KR 1020180136845 A KR1020180136845 A KR 1020180136845A KR 20180136845 A KR20180136845 A KR 20180136845A KR 20200053341 A KR20200053341 A KR 20200053341A
Authority
KR
South Korea
Prior art keywords
name
threshold value
user
threshold
name candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
KR1020180136845A
Other languages
Korean (ko)
Other versions
KR102613210B1 (en
Inventor
이경철
Original Assignee
현대자동차주식회사
기아자동차주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 현대자동차주식회사, 기아자동차주식회사 filed Critical 현대자동차주식회사
Priority to KR1020180136845A priority Critical patent/KR102613210B1/en
Priority to US16/265,723 priority patent/US11189276B2/en
Priority to CN201910185588.5A priority patent/CN111161720B/en
Publication of KR20200053341A publication Critical patent/KR20200053341A/en
Application granted granted Critical
Publication of KR102613210B1 publication Critical patent/KR102613210B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/023Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for transmission of signals between vehicle parts or subsystems
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W50/08Interaction between the driver and the control system
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6075Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle
    • H04M1/6083Portable telephones adapted for handsfree use adapted for handsfree use in a vehicle by interfacing with the vehicle audio system
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • B60W40/08Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models related to drivers or passengers
    • B60W2040/089Driver voice
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W50/00Details of control systems for road vehicle drive control not related to the control of a particular sub-unit, e.g. process diagnostic or vehicle driver interfaces
    • B60W2050/0062Adapting control system settings
    • B60W2050/0075Automatic parameter input, automatic initialising or calibrating means
    • B60W2050/009Priority selection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/227Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Transportation (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)
  • Navigation (AREA)

Abstract

개시된 일 실시예에 따른 차량은, 통화 기능을 제공하는 단말기과 통신하는 통신부; 사용자의 음성을 입력 받는 음성 입력부; 사용자의 통화 패턴에 관한 사용자 패턴을 저장하는 저장부; 및 사용자의 음성이 입력되면 상기 입력된 음성에 대응하는 적어도 하나의 이름 후보를 검색하고, 적어도 하나의 이름 후보의 신뢰도 점수(confidence score)에 대한 임계값(threshold)을 사용자 패턴에 기초하여 결정하고, 적어도 하나의 이름 후보 중 입력된 음성에 대응하는 이름을 결정된 임계값에 기초하여 선택하는 제어부;를 포함한다.A vehicle according to one disclosed embodiment includes a communication unit communicating with a terminal providing a call function; A voice input unit that receives a user's voice; A storage unit that stores a user pattern related to the user's call pattern; And when a user's voice is input, search for at least one name candidate corresponding to the input voice, and determine a threshold for a confidence score of the at least one name candidate based on a user pattern. , A controller for selecting a name corresponding to the input voice among at least one name candidate based on the determined threshold.

Description

차량 및 그 제어방법{VEHICLE AND CONTROLLING METHOD THEREOF}Vehicle and its control method {VEHICLE AND CONTROLLING METHOD THEREOF}

사용자의 음성을 인식하고, 인식된 음성에 따라 특정 기능을 수행하는 차량 및 그 제어방법에 관한 것이다. It relates to a vehicle that recognizes a user's voice and performs a specific function according to the recognized voice and a control method thereof.

차량에 대한 기술이 발전함에 따라, 차량이 수행하는 기본적인 기능인 주행 이외에도 사용자의 편의를 위한 다양한 기능이 제공되고 있다. As the technology of a vehicle develops, various functions for user convenience are provided in addition to driving, which is a basic function performed by the vehicle.

이처럼 차량이 수행할 수 있는 기능이 다양해지면서 사용자의 조작 부하가 증가되고, 조작 부하의 증가는 운전에 대한 집중도를 저하시켜 안전 운전을 방해하는 요인이 된다. As the functions that the vehicle can perform are diversified, the user's operation load is increased, and the increase in the operation load is a factor that degrades concentration on driving and hinders safe driving.

따라서, 사용자의 조작 부하를 감소시키기 위한 사용자 인터페이스에 대한 연구 및 개발이 요구되는바, 특히, 사용자의 음성을 인식하여 해당 음성에 대응되는 기능을 수행하는 음성 인식 기술이 차량에 적용되면, 사용자의 조작 부하를 효과적으로 감소시킬 수 있을 것으로 기대된다.Accordingly, research and development of a user interface for reducing a user's operation load is required. In particular, when a voice recognition technology that recognizes a user's voice and performs a function corresponding to the voice is applied to the vehicle, the user's It is expected that the operation load can be effectively reduced.

일 측면은 사용자의 음성을 인식하고, 사용자의 음성에 대응하는 기능을 제공하는 차량 및 그 제어방법을 제공한다.One aspect provides a vehicle that recognizes a user's voice and provides a function corresponding to the user's voice and a control method thereof.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 일 측면에 따른 차량은, 통화 기능을 제공하는 단말기과 통신하는 통신부; 사용자의 음성을 입력 받는 음성 입력부; 상기 사용자의 통화 패턴에 관한 사용자 패턴을 저장하는 저장부; 및 상기 사용자의 음성이 입력되면 상기 입력된 음성에 대응하는 적어도 하나의 이름 후보를 검색하고, 상기 적어도 하나의 이름 후보의 신뢰도 점수(confidence score)에 대한 임계값(threshold)을 상기 사용자 패턴에 기초하여 결정하고, 상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 제어부;를 포함한다.As a technical means for achieving the above-described technical problem, a vehicle according to an aspect includes: a communication unit communicating with a terminal providing a call function; A voice input unit that receives a user's voice; A storage unit that stores a user pattern related to the user's call pattern; And when the user's voice is input, search for at least one name candidate corresponding to the input voice, and set a threshold for a confidence score of the at least one name candidate based on the user pattern. And a controller which selects a name corresponding to the input voice among the at least one name candidate based on the determined threshold value.

또한, 상기 제어부는, 상기 단말기의 폰북 정보 및 통화 내역 정보가 수신되면, 상기 수신된 폰북 정보 및 통화 내역 정보에 기초하여 사용자 패턴을 생성할 수 있다.In addition, when the phonebook information and the call history information of the terminal are received, the controller may generate a user pattern based on the received phonebook information and call history information.

또한, 상기 제어부는, 상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보 중 상기 입력된 음성에 대응하는 이름을 선택할 수 있다.In addition, the controller may select a name corresponding to the input voice among name candidates whose reliability score exceeds the first threshold.

또한, 상기 제어부는, 상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보의 개수가 1개인 경우, 해당 이름 후보의 신뢰도 점수가 제 2 임계값을 초과하는지 여부를 판단하고, 해당 이름 후보의 신뢰도 점수가 제 2 임계값을 초과하면, 해당 이름 후보를 상기 입력된 음성에 대응하는 이름으로 선택할 수 있다.In addition, when the number of name candidates whose reliability score exceeds the first threshold is 1, the controller determines whether the reliability score of the name candidate exceeds the second threshold, and the reliability of the name candidate If the score exceeds the second threshold, the name candidate can be selected as a name corresponding to the input voice.

또한, 상기 제어부는, 상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보의 신뢰도 점수가 상기 제2임계값 이하이면, 해당 이름 후보에 대한 확인을 상기 사용자에게 요청할 수 있다.In addition, if the reliability score of the name candidate whose reliability score exceeds the first threshold is less than or equal to the second threshold, the controller may request the user to confirm the name candidate.

또한, 상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보의 개수가 복수개인 경우, 상기 복수개의 이름 후보의 우선 순위를 상기 신뢰도 점수에 기초하여 결정하고, 상기 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이와 제3임계값을 비교하고, 상기 비교 결과에 기초하여 상기 입력된 음성에 대응하는 이름을 선택할 수 있다.In addition, when the number of name candidates whose reliability score exceeds the first threshold is plural, the priority of the plurality of name candidates is determined based on the reliability score, and the name candidate whose priority is the first priority And a third score and a difference in the reliability score between the second and second name candidates, and selecting a name corresponding to the input voice based on the comparison result.

또한, 상기 제어부는, 상기 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이가 상기 제3임계값을 초과하면, 상기 우선 순위가 제1순위인 이름 후보를 상기 입력된 음성에 대응하는 이름으로 선택할 수 있다.In addition, when the difference in the reliability score between the first-ranked name candidate and the second-ranked name candidate exceeds the third threshold, the control unit selects the first-ranked name candidate. It can be selected as a name corresponding to the input voice.

또한, 상기 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이가 상기 제3임계값 이하이면, 상기 우선 순위가 제1순위인 이름 후보에 대한 확인을 상기 사용자에게 요청할 수 있다.In addition, if the difference in the reliability score between the first-ranked name candidate and the second-ranked name candidate is equal to or less than the third threshold, the user is prompted to confirm the first-ranked name candidate. You can ask.

또한, 상기 제어부는, 상기 단말기의 폰북 정보가 수신되면, 상기 수신된 폰북 정보 중 상기 입력된 음성에 대응하는 적어도 하나의 이름 후보를 검색하고, 상기 검색된 이름 후보의 개수에 기초하여 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경할 수 있다.In addition, when the phonebook information of the terminal is received, the controller searches for at least one name candidate corresponding to the input voice among the received phonebook information, and a first threshold value based on the number of searched name candidates. , At least one of the second threshold value or the third threshold value may be changed.

또한, 상기 제어부는, 상기 검색된 이름 후보의 개수가 미리 정해진 제1기준 개수 이하인 경우, 상기 제2임계값을 증가시키고, 상기 제3임계값을 감소시킬 수 있다.Also, when the number of searched candidates is less than or equal to a predetermined first reference number, the control unit may increase the second threshold value and decrease the third threshold value.

또한, 상기 제어부는, 상기 폰북 정보로부터 상기 검색된 이름 후보에 대한 카테고리의 개수를 확인하고, 상기 카테고리의 개수에 기초하여 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경할 수 있다.In addition, the control unit may check the number of categories for the searched name candidate from the phonebook information, and change at least one of a first threshold value, a second threshold value, or a third threshold value based on the number of categories. have.

또한, 상기 제어부는, 상기 카테고리의 개수가 미리 정해진 제2기준 개수 이하인 경우, 상기 제2임계값을 증가시키고, 상기 제3임계값을 감소시킬 수 있다.In addition, when the number of the categories is equal to or less than a predetermined second reference number, the control unit may increase the second threshold value and decrease the third threshold value.

또한, 상기 제어부는, 상기 선택된 이름에 대한 제어 명령을 상기 단말기로 전송하도록 상기 통신부를 제어할 수 있다.In addition, the control unit may control the communication unit to transmit a control command for the selected name to the terminal.

다른 측면에 따른 차량은, 사용자의 음성을 입력 받고; 상기 사용자의 음성이 입력되면 상기 입력된 음성에 대응하는 적어도 하나의 이름 후보를 검색하고; 상기 적어도 하나의 이름 후보의 신뢰도 점수(confidence score)에 대한 임계값(threshold)을 사용자 패턴에 기초하여 결정하고; 상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 것;을 포함한다.A vehicle according to another aspect receives a user's voice; When the user's voice is input, search for at least one name candidate corresponding to the input voice; Determining a threshold for a confidence score of the at least one name candidate based on a user pattern; And selecting a name corresponding to the input voice among the at least one name candidate based on the determined threshold.

또한, 단말기의 폰북 정보 및 통화 내역 정보가 수신되면, 상기 수신된 폰북 정보 및 통화 내역 정보에 기초하여 사용자 패턴을 생성하는 것;을 더 포함할 수 있다.In addition, when the phonebook information and call history information of the terminal is received, generating a user pattern based on the received phonebook information and call history information; may further include.

또한, 상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 것은, 상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보 중 상기 입력된 음성에 대응하는 이름을 선택하는 것;을 포함할 수 있다.Further, selecting a name corresponding to the input voice among the at least one name candidate based on the determined threshold value corresponds to the input voice among the name candidates in which the reliability score exceeds a first threshold value. Selecting a name; may include.

또한, 상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 것은, 상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보의 개수가 1개인 경우, 해당 이름 후보의 신뢰도 점수가 제 2 임계값을 초과하는지 여부를 판단하고, 해당 이름 후보의 신뢰도 점수가 제 2 임계값을 초과하면, 해당 이름 후보를 상기 입력된 음성에 대응하는 이름으로 선택하는 것;을 포함할 수 있다.In addition, selecting the name corresponding to the input voice among the at least one name candidate based on the determined threshold value corresponds to a case in which the number of name candidates whose reliability score exceeds the first threshold is 1 Determining whether the reliability score of the name candidate exceeds the second threshold, and when the reliability score of the name candidate exceeds the second threshold, selecting the name candidate as a name corresponding to the input voice; It may include.

또한, 상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보의 신뢰도 점수가 상기 제2임계값 이하이면, 해당 이름 후보에 대한 확인을 상기 사용자에게 요청하는 것;을 더 포함할 수 있다.In addition, if the reliability score of the name candidate whose confidence score exceeds the first threshold is less than or equal to the second threshold, requesting confirmation from the name candidate about the name candidate may be further included.

또한, 상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 것은, 상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보의 개수가 복수개인 경우, 상기 복수개의 이름 후보의 우선 순위를 상기 신뢰도 점수에 기초하여 결정하고; 상기 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이와 제3임계값을 비교하고; 및 상기 비교 결과에 기초하여 상기 입력된 음성에 대응하는 이름을 선택하는 것;을 포함할 수 있다.Further, selecting a name corresponding to the input voice among the at least one name candidate based on the determined threshold value, when the number of name candidates whose reliability score exceeds the first threshold value is plural. Prioritizing a plurality of name candidates based on the reliability score; Comparing the difference in reliability scores between the first and second priority name candidates and the third threshold; And selecting a name corresponding to the input voice based on the comparison result.

또한, 상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 것은, 상기 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이가 상기 제3임계값을 초과하면, 상기 우선 순위가 제1순위인 이름 후보를 상기 입력된 음성에 대응하는 이름으로 선택하는 것;을 포함할 수 있다.In addition, selecting a name corresponding to the input voice among the at least one name candidate based on the determined threshold value is a reliability score between the first-ranked name candidate and the second-ranked name candidate. And when the difference of exceeds the third threshold, selecting a name candidate whose priority is the first priority as a name corresponding to the input voice.

또한, 상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 것은, 상기 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이가 상기 제3임계값 이하이면, 상기 우선 순위가 제1순위인 이름 후보에 대한 확인을 상기 사용자에게 요청하는 것;을 포함할 수 있다.In addition, selecting a name corresponding to the input voice among the at least one name candidate based on the determined threshold value is a reliability score between the first-ranked name candidate and the second-ranked name candidate. If the difference of is less than or equal to the third threshold, requesting the user for confirmation of a name candidate whose priority is the first priority may include.

또한, 적어도 하나의 이름 후보를 검색하는 것은, 상기 단말기의 폰북 정보가 수신되면, 상기 수신된 폰북 정보 중 상기 입력된 음성에 대응하는 적어도 하나의 이름 후보를 검색하고, 상기 적어도 하나의 이름 후보의 신뢰도 점수(confidence score)에 대한 임계값(threshold)을 사용자 패턴에 기초하여 결정하는 것은, 상기 검색된 이름 후보의 개수에 기초하여 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경하는 것;을 포함할 수 있다.Also, searching for at least one name candidate may include, when phonebook information of the terminal is received, search for at least one name candidate corresponding to the input voice among the received phonebook information, and search for at least one name candidate. Determining a threshold for a confidence score based on a user pattern may include at least one of a first threshold value, a second threshold value, or a third threshold value based on the number of searched name candidates. Change; may include.

또한, 상기 검색된 이름 후보의 개수에 기초하여 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경하는 것은, 상기 검색된 이름 후보의 개수가 미리 정해진 제1기준 개수 이하인 경우, 상기 제2임계값을 증가시키고, 상기 제3임계값을 감소시키는 것;을 포함할 수 있다.Further, changing at least one of the first threshold value, the second threshold value, or the third threshold value based on the number of searched name candidates, when the number of searched name candidates is equal to or less than a predetermined first reference number, the And increasing the second threshold value and decreasing the third threshold value.

또한, 상기 적어도 하나의 이름 후보의 신뢰도 점수(confidence score)에 대한 임계값(threshold)을 사용자 패턴에 기초하여 결정하는 것은, 상기 폰북 정보로부터 상기 검색된 이름 후보에 대한 카테고리의 개수를 확인하고, 상기 카테고리의 개수에 기초하여 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경하는 것;을 포함할 수 있다.Further, determining a threshold for a confidence score of the at least one name candidate based on a user pattern, confirms the number of categories for the searched name candidate from the phonebook information, and And changing at least one of the first threshold value, the second threshold value, or the third threshold value based on the number of categories.

또한, 상기 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경하는 것은, 상기 카테고리의 개수가 미리 정해진 제2기준 개수 이하인 경우, 상기 제2임계값을 증가시키고, 상기 제3임계값을 감소시키는 것;을 포함할 수 있다.Further, changing at least one of the first threshold value, the second threshold value, or the third threshold value increases the second threshold value when the number of categories is equal to or less than a predetermined second reference number, and the second threshold value is increased. 3 to decrease the threshold; may include.

또한, 상기 선택된 이름에 대한 제어 명령을 상기 단말기로 전송하는 것;을 더 포함할 수 있다.In addition, it may further include; transmitting a control command for the selected name to the terminal.

일 측면에 따른 차량 및 그 제어방법에 따르면, 보다 정확하고 빠른 음성 인식 기능이 제공될 수 있으므로, 사용자의 편의성이 증대될 수 있다. According to the vehicle and its control method according to an aspect, a more accurate and fast voice recognition function may be provided, so that user convenience may be increased.

도 1은 일 실시예에 따른 차량의 제어 블록도이다.
도2는 일 실시예에 따른 차량의 내부 구성을 나타낸 도면이다.
도 3은 일 실시예에 따른 제어부의 동작을 설명하기 위한 도면이다.
도 4 및 도 5는 일 실시예에 따른 인식 결과의 예시를 나타낸 도면이다.
도 6은 일 실시예에 따른 사용자 패턴의 예시를 나타낸 도면이다.
도 7 및 도 8은 일 실시예에 다른 디스플레이에 표시될 수 있는 화면의 예시를 나타낸 도면이다.
도 9 및 도 10은 일 실시예에 따른 차량의 제어방법을 나타낸 흐름도이다.
1 is a control block diagram of a vehicle according to an embodiment.
2 is a view showing the internal configuration of a vehicle according to an embodiment.
3 is a view for explaining the operation of the control unit according to an embodiment.
4 and 5 are diagrams illustrating examples of recognition results according to an embodiment.
6 is a diagram illustrating an example of a user pattern according to an embodiment.
7 and 8 are views showing an example of a screen that can be displayed on another display in one embodiment.
9 and 10 are flowcharts illustrating a method for controlling a vehicle according to an embodiment.

명세서 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 명세서가 실시예들의 모든 요소들을 설명하는 것은 아니며, 본 발명이 속하는 기술분야에서 일반적인 내용 또는 실시예들 간에 중복되는 내용은 생략한다. 명세서에서 사용되는 '부, 모듈, 부재, 블록'이라는 용어는 소프트웨어 또는 하드웨어로 구현될 수 있으며, 실시예들에 따라 복수의 '부, 모듈, 부재, 블록'이 하나의 구성요소로 구현되거나, 하나의 '부, 모듈, 부재, 블록'이 복수의 구성요소들을 포함하는 것도 가능하다. The same reference numerals refer to the same components throughout the specification. This specification does not describe all elements of the embodiments, and overlaps between general contents or embodiments in the technical field to which the present invention pertains are omitted. The term 'unit, module, member, block' used in the specification may be implemented by software or hardware, and according to embodiments, a plurality of 'unit, module, member, block' may be implemented as one component, It is also possible that one 'part, module, member, block' includes a plurality of components.

명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 간접적으로 연결되어 있는 경우를 포함하고, 간접적인 연결은 무선 통신망을 통해 연결되는 것을 포함한다.Throughout the specification, when a part is "connected" to another part, this includes not only a direct connection but also an indirect connection, and an indirect connection includes connecting through a wireless communication network. do.

또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.Also, when a part “includes” a certain component, this means that other components may be further included, rather than excluding other components, unless otherwise specified.

명세서 전체에서, 어떤 부재가 다른 부재 "상에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다. Throughout the specification, when one member is positioned “on” another member, this includes not only the case where one member abuts another member, but also the case where another member exists between the two members.

제 1, 제 2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위해 사용되는 것으로, 구성요소가 전술된 용어들에 의해 제한되는 것은 아니다. Terms such as first and second are used to distinguish one component from other components, and the component is not limited by the above-mentioned terms.

단수의 표현은 문맥상 명백하게 예외가 있지 않는 한, 복수의 표현을 포함한다.Singular expressions include plural expressions, unless the context clearly has an exception.

각 단계들에 있어 식별부호는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다.In each step, the identification code is used for convenience of explanation. The identification code does not describe the order of each step, and each step can be executed differently from the specified order unless a specific order is clearly stated in the context. have.

이하 첨부된 도면들을 참고하여 본 발명의 작용 원리 및 실시예들에 대해 설명한다.Hereinafter, working principles and embodiments of the present invention will be described with reference to the accompanying drawings.

도 1은 일 실시예에 따른 차량의 제어 블록도이고, 도 2는 일 실시예에 따른 차량의 내부 구성을 나타낸 도면이다.1 is a control block diagram of a vehicle according to an embodiment, and FIG. 2 is a diagram showing an internal configuration of a vehicle according to an embodiment.

도 1 및 도 2를 참조하면, 일 실시예에 따른 차량(1)은 음성 입력부(110), 통신부(120), 스피커(151), 디스플레이(152), 제어부(130), 저장부(140) 및 입력부(160)를 포함할 수 있다. 1 and 2, the vehicle 1 according to an embodiment includes a voice input unit 110, a communication unit 120, a speaker 151, a display 152, a control unit 130, and a storage unit 140 And it may include an input unit 160.

차량(1)은 사용자의 제어 명령을 음성 입력부(110)를 통해 음성으로 입력 받을 수 있다. 음성 입력부(110)는 음향을 입력 받아 전기적인 신호로 변환하여 출력할 수 있다. 이를 위해, 음성 입력부(110)는 마이크로폰으로 구현될 수 있으나, 이에 한정되지는 않는다.The vehicle 1 may receive a user's control command by voice through the voice input unit 110. The voice input unit 110 may receive sound and convert it into an electrical signal to output the sound. To this end, the voice input unit 110 may be implemented as a microphone, but is not limited thereto.

효과적인 음성의 입력을 위하여 음성 입력부(110)는 도 2에 도시된 바와 같이 헤드라이닝(64)에 장착될 수 있으나, 차량(1)의 실시예가 이에 한정되는 것은 아니며, 대시보드(61) 위에 장착되거나 스티어링 휠(65)에 장착되는 것도 가능하다. 이 외에도 사용자의 음성을 입력 받기에 적합한 위치이면 어디든 제한이 없다.For effective voice input, the voice input unit 110 may be mounted on the headlining 64 as illustrated in FIG. 2, but the embodiment of the vehicle 1 is not limited thereto, and is mounted on the dashboard 61 It is also possible to be mounted on the steering wheel (65). In addition to this, there is no restriction on any location suitable for receiving a user's voice.

통신부(120)는 외부의 서버 또는 단말기(2)와 통신할 수 있다. 통신부(120)는 단말기(2)과 다양한 정보를 송수신할 수 있다. 구체적으로, 통신부(120)는 단말기(2)로부터 폰북 정보 및 통화 내역 정보를 수신할 수 있다. The communication unit 120 may communicate with an external server or terminal 2. The communication unit 120 may transmit and receive various information with the terminal 2. Specifically, the communication unit 120 may receive phonebook information and call history information from the terminal 2.

이 때, 폰북 정보는 이름, 이름별 전화 번호, 이름별 즐겨찾기 설정 정보 및 이름별 카테고리를 포함할 수 있다. 여기서, 이름별 카테고리는 이름별 전화 번호에 대한 종류를 의미하며, 예를 들어, 카테고리는 '모바일', '집' 및 '오피스' 중 적어도 하나일 수 있다. At this time, the phonebook information may include a name, a phone number for each name, favorite setting information for each name, and a category for each name. Here, the category by name means the type of the phone number by name, and for example, the category may be at least one of 'mobile', 'home', and 'office'.

통화 내역 정보는 이름, 이름별 발신, 수신 정보, 이름별 발신 시간, 이름별 수신시간 정보를 포함한다. 여기서 통화 내역 정보는 최근 통화한 시간부터 시간 순서대로 나열될 수 있다. 아울러 나열된 통화 내역 정보는 발신별, 송신별로 각각 나열되는 것도 가능하고, 발신 및 송신 여부와 상관없이 시간 순서대로 나열되는 것도 가능하다. The call history information includes name, transmission by name, reception information, transmission time by name, and reception time information by name. Here, the call history information may be arranged in chronological order from the time of the last call. In addition, the listed call history information may be listed for each transmission and transmission, respectively, and may be arranged in chronological order irrespective of whether it is originated or transmitted.

한편, 단말기(2)는 통화 기능을 수행할 수 있는 장치를 의미한다. 단말기(2)는 네트워크를 통해 차량(1)에 접속할 수 있는 컴퓨터나 휴대용 단말기로 구현될 수 있다. 여기서, 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop), 태블릿 PC, 슬레이트 PC 등을 포함하고, 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), WiBro(Wireless Broadband Internet) 단말, 스마트 폰(Smart Phone) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치와 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD) 등과 같은 웨어러블 장치를 포함할 수 있다.On the other hand, the terminal 2 means a device capable of performing a call function. The terminal 2 may be embodied as a computer or a portable terminal capable of accessing the vehicle 1 through a network. Here, the computer includes, for example, a laptop equipped with a web browser (WEB Browser), a desktop (desktop), a laptop (laptop), a tablet PC, a slate PC, and the like, and the portable terminal has, for example, portability and mobility. As a guaranteed wireless communication device, PCS (Personal Communication System), GSM (Global System for Mobile communications), PDC (Personal Digital Cellular), PHS (Personal Handyphone System), PDA (Personal Digital Assistant), IMT (International Mobile Telecommunication) -2000, CDMA (Code Division Multiple Access) -2000, W-CDMA (W-Code Division Multiple Access), WiBro (Wireless Broadband Internet) terminal, smart phone (Smart Phone), etc. And a wearable device such as a watch, ring, bracelet, anklet, necklace, glasses, contact lens, or head-mounted-device (HMD).

통신부(120)는 외부 장치와 통신을 가능하게 하는 하나 이상의 통신 모듈을 포함할 수 있으며, 예를 들어 근거리 통신 모듈, 유선 통신 모듈 및 무선 통신 모듈 중 적어도 하나를 포함할 수 있다.The communication unit 120 may include one or more communication modules that enable communication with external devices, and may include at least one of a short-range communication module, a wired communication module, and a wireless communication module.

근거리 통신 모듈은 블루투스 모듈, 적외선 통신 모듈, RFID(Radio Frequency Identification) 통신 모듈, WLAN(Wireless Local Access Network) 통신 모ㄴ듈, NFC 통신 모듈, 직비(Zigbee) 통신 모듈 등 근거리에서 무선 통신망을 이용하여 신호를 송수신하는 다양한 근거리 통신 모듈을 포함할 수 있다.The short-range communication module uses a wireless communication network at a short distance, such as a Bluetooth module, an infrared communication module, a radio frequency identification (RFID) communication module, a wireless local access network (WLAN) communication module, an NFC communication module, and a Zigbee communication module. Various short-range communication modules for transmitting and receiving signals may be included.

유선 통신 모듈은 지역 통신(Local Area Network; LAN) 모듈, 광역 통신(Wide Area Network; WAN) 모듈 또는 부가가치 통신(Value Added Network; VAN) 모듈 등 다양한 유선 통신 모듈뿐만 아니라, USB(Universal Serial Bus), HDMI(High Definition Multimedia Interface), DVI(Digital Visual Interface), RS-232(recommended standard232), 전력선 통신, 또는 POTS(plain old telephone service) 등 다양한 케이블 통신 모듈을 포함할 수 있다. The wired communication module includes a variety of wired communication modules such as a local area network (LAN) module, a wide area network (WAN) module, or a value added network (VAN) module, as well as a universal serial bus (USB). , HDMI (High Definition Multimedia Interface), DVI (Digital Visual Interface), RS-232 (recommended standard232), power line communication, or a plain old telephone service (POTS).

무선 통신 모듈은 와이파이(Wifi) 모듈, 와이브로(Wireless broadband) 모듈 외에도, GSM(global System for Mobile Communication), CDMA(Code Division Multiple Access), WCDMA(Wideband Code Division Multiple Access), UMTS(universal mobile telecommunications system), TDMA(Time Division Multiple Access), LTE(Long Term Evolution) 등 다양한 무선 통신 방식을 지원하는 무선 통신 모듈을 포함할 수 있다.In addition to the Wi-Fi module and Wireless broadband module, the wireless communication module includes Global System for Mobile Communication (GSM), Code Division Multiple Access (CDMA), Wideband Code Division Multiple Access (WCDMA), and universal mobile telecommunications system (UMTS). ), A wireless communication module supporting various wireless communication methods such as Time Division Multiple Access (TDMA), Long Term Evolution (LTE), and the like.

또한, 무선 통신 모듈은 신호를 송수신하는 안테나, 송신기(Transmitter) 및 수신기(Receiver)를 포함할 수 있다. Further, the wireless communication module may include an antenna for transmitting and receiving signals, a transmitter, and a receiver.

또한, 무선 통신 모듈은 디지털 제어 신호를 아날로그 형태의 무선 신호로 변조하고, 수신한 아날로그 형태의 무선 신호를 디지털 제어 신호로 복조하기 위한 신호 변환 모듈을 더 포함할 수 있다.In addition, the wireless communication module may further include a signal conversion module for modulating the digital control signal into an analog type wireless signal and demodulating the received analog type wireless signal into a digital control signal.

또한, 통신부(120)는 차량(1) 내부의 전자 장치들 사이의 통신을 위한 내부 통신 모듈을 더 포함할 수도 있다. 차량(1)의 내부 통신 프로토콜로는 CAN(Controller Area Network), LIN(Local Interconnection Network), 플렉스레이(FlexRay), 이더넷(Ethernet) 등을 사용할 수 있다. Also, the communication unit 120 may further include an internal communication module for communication between electronic devices inside the vehicle 1. As an internal communication protocol of the vehicle 1, a controller area network (CAN), a local interconnection network (LIN), a flexray, and an Ethernet may be used.

통신부(120)는 무선 통신 모듈을 이용하여 외부의 서버와 데이터를 주고 받을 수 있고, 근거리 통신 모듈 또는 유선 통신 모듈을 이용하여 모바일 기기와 데이터를 주고 받을 수 있다.The communication unit 120 may exchange data with an external server using a wireless communication module, and exchange data with a mobile device using a short-range communication module or a wired communication module.

차량(1) 내부의 대시보드(61)의 중앙 영역인 센터페시아(62)에는 오디오 기능, 비디오 기능, 내비게이션 기능, 전화 걸기 기능을 포함하는 차량의 제어를 수행하기 위해 필요한 화면을 표시하는 디스플레이(152)와 사용자의 제어 명령을 입력 받기 위한 입력부(160)가 마련될 수 있다. The center fascia 62, which is the central area of the dashboard 61 inside the vehicle 1, displays on the screen required to perform control of the vehicle including audio functions, video functions, navigation functions, and dialing functions ( 152) and an input unit 160 for receiving a user's control command may be provided.

디스플레이(152)는 음극선관(Cathode Ray Tube: CRT), 디지털 광원 처리(Digital Light Processing: DLP) 패널, 플라즈마 디스플레이 패널(Plasma Display Penal), 액정 디스플레이(Liquid Crystal Display: LCD) 패널, 전기 발광(Electro Luminescence: EL) 패널, 전기영동 디스플레이(Electrophoretic Display: EPD) 패널, 전기변색 디스플레이(Electrochromic Display: ECD) 패널, 발광 다이오드(Light Emitting Diode: LED) 패널 또는 유기 발광 다이오드(Organic Light Emitting Diode: OLED) 패널 등의 다양한 디스플레이 장치 중 하나로 구현될 수 있다.The display 152 includes a cathode ray tube (CRT), a digital light processing (DLP) panel, a plasma display panel, a liquid crystal display (LCD) panel, and electroluminescence ( Electro Luminescence (EL) panel, Electrotrophic Display (EPD) panel, Electrochromic Display (ECD) panel, Light Emitting Diode (LED) panel or Organic Light Emitting Diode (OLED) ) It can be implemented as one of various display devices such as panels.

사용자는 입력부(160)를 조작하여 차량(1)을 제어하기 위한 명령을 입력할 수 있다. 입력부(160)는 도 2에 도시된 바와 같이 디스플레이(152)와 인접한 영역에 하드 키 타입으로 마련될 수도 있고, 디스플레이(152)가 터치 스크린 타입으로 구현되는 경우에는 디스플레이(152)가 입력부(160)의 기능도 함께 수행할 수 있다.The user may input a command for controlling the vehicle 1 by operating the input unit 160. As illustrated in FIG. 2, the input unit 160 may be provided as a hard key type in an area adjacent to the display 152, and when the display 152 is implemented as a touch screen type, the display 152 is an input unit 160 ) Can also be performed.

입력부(160)는 스티어링 휠에도 마련되어 운전 중인 운전자가 스티어링 휠에서 손을 떼지 않은 상태에서도 차량(1)의 제어와 관련된 명령을 입력할 수 있도록 할 수 있다. The input unit 160 is also provided on the steering wheel, so that a driving driver can input a command related to the control of the vehicle 1 even without releasing the steering wheel.

또한, 입력부(160)는 죠그 셔틀(jog shuttle) 타입 또는 하드 키 타입의 센터 입력부(43)에도 마련될 수 있으며, 차량(1)의 제어와 관련된 명령을 입력할 수 있는 구성을 모두 포함할 수 있다.In addition, the input unit 160 may be provided in the center input unit 43 of a jog shuttle type or a hard key type, and may include all of the components capable of inputting commands related to the control of the vehicle 1. have.

또한, 차량(1) 내부에는 사용자가 원하는 서비스를 제공하기 위해 필요한 음향을 출력하는 스피커(151)가 마련될 수 있다. 일 예로, 스피커(151)는 운전석 도어(71L) 및 조수석 도어(71R) 내측에 마련될 수 있다.In addition, a speaker 151 for outputting sound necessary for providing a service desired by a user may be provided inside the vehicle 1. For example, the speaker 151 may be provided inside the driver's seat door 71L and the passenger seat door 71R.

스피커(151)는 통화 기능을 제공하기 위한 음성, 내비게이션 경로 안내를 위한 음성, 오디오/비디오 컨텐츠에 포함되는 음향 또는 음성, 사용자가 원하는 정보나 서비스를 제공하기 위한 음성, 사용자의 발화에 대한 응답으로서 생성된 음성 등을 출력할 수 있다.The speaker 151 is a voice for providing a call function, a voice for guiding a navigation route, sound or voice included in audio / video content, a voice for providing information or a service desired by the user, and a response to a user's speech The generated voice and the like can be output.

제어부(130)는 차량(1)의 내부 구성에 대한 전반적인 제어를 수행할 수 있다. The control unit 130 may perform overall control of the internal configuration of the vehicle 1.

제어부(130)는 단말기(2)와 다양한 정보를 송수신하도록 통신부(120)를 제어할 수 있다. 구체적으로, 제어부(130)는 단말기(2)로부터 폰북 정보 및 통화 내역 정보 등을 포함하는 다양한 정보들을 수신하도록 통신부(120)를 제어할 수 있다. The control unit 130 may control the communication unit 120 to transmit and receive various information to and from the terminal 2. Specifically, the control unit 130 may control the communication unit 120 to receive various information, including phone book information and call history information, from the terminal 2.

제어부(130)는 단말기(2)로부터 수신된 폰북 정보 및 통화 내역 정보에 기초하여 사용자 패턴을 생성할 수 있다. 구체적으로, 제어부(130)는 폰북 정보 및 통화 내역 정보에 기초하여 사용자의 통화 내역의 특징을 파악하기 위해 필요한 정보들을 추출 또는 수집함으로써 사용자 패턴을 생성할 수 있다. The controller 130 may generate a user pattern based on the phonebook information and the call history information received from the terminal 2. Specifically, the control unit 130 may generate a user pattern by extracting or collecting information necessary to understand the characteristics of the user's call history based on the phonebook information and the call history information.

이 때, 사용자 패턴은 사용자의 통화 패턴에 관한 정보를 의미하며, 구체적으로 시간별 사용자의 통화 내역의 특징 정보를 의미할 수 있다. 사용자 패턴은 폰북 정보의 이름, 이름별 카테고리, 이름별 통화 횟수, 이름별 발신 시간, 이름별 수신 시간, 이름별 카테고리에 대한 발신 시간, 이름별 카테고리에 대한 수신 시간 등을 포함할 수 있다. 이 외에도 사용자 패턴은 이름별 신뢰도 점수(confidence score), 이름별 신뢰도 점수에 대한 적어도 하나의 임계값, 이름별 추천된 액션 및 이름별 추천된 액션의 수행 여부 등의 사용자의 통화 패턴을 판단하기 위하여 필요한 다양한 정보들을 포함할 수 있다. At this time, the user pattern refers to information on the user's call pattern, and may specifically refer to feature information of the user's call history by time. The user pattern may include the name of the phonebook information, a category by name, a number of calls by name, a transmission time by name, a reception time by name, a transmission time for a category by name, a reception time for a category by name, and the like. In addition, the user pattern is used to determine a user's call pattern, such as whether a confidence score for each name, a confidence score for each name, at least one threshold value for each name, a recommended action by name, and a recommended action by name are performed. It may contain various information needed.

또한, 제어부(130)는 음성 입력부(110)를 통하여 사용자의 음성이 입력되면, 입력된 음성에 대응하는 이름에 대한 제어 명령을 단말기(2)로 전송하도록 통신부(120)를 제어할 수 있다. In addition, when the user's voice is input through the voice input unit 110, the control unit 130 may control the communication unit 120 to transmit a control command for the name corresponding to the input voice to the terminal 2.

이 때, 제어부(130)는 사용자의 음성에 대응하는 이름에 대한 통화 발신 명령을 단말기(2)로 전송하도록 통신부(120)를 제어할 수 있다. 제어부(130)는 사용자의 음성에 대응하는 이름과 매칭된 전화번호를 함께 전송할 수 있으며, 통신부(120)를 통하여 해당 이름에 대한 통화 발신 명령을 단말기(2)로 전송할 수 있다. At this time, the control unit 130 may control the communication unit 120 to transmit a call originating command for the name corresponding to the user's voice to the terminal 2. The control unit 130 may transmit a phone number matching the name corresponding to the user's voice, and may transmit a call origination command for the name to the terminal 2 through the communication unit 120.

이를 위해, 제어부(130)는 사용자의 음성에 대응하는 적어도 하나의 이름 후보를 검색할 수 있고, 적어도 하나의 이름 후보의 신뢰도 점수(confidence score)에 대한 임계값(threshold)을 사용자 패턴에 기초하여 결정할 수 있다. 제어부(130)는 적어도 하나의 이름 후보 중 입력된 음성에 대응하는 이름을 결정된 임계값에 기초하여 선택할 수 있다. 이에 관한 자세한 설명은 후술한다. To this end, the control unit 130 may search for at least one name candidate corresponding to the user's voice, and the threshold for the confidence score of the at least one name candidate based on the user pattern Can decide. The controller 130 may select a name corresponding to the input voice among the at least one name candidate based on the determined threshold. This will be described in detail later.

한편, 제어부는 차량(1) 내 구성요소들의 동작을 제어하기 위한 알고리즘 또는 알고리즘을 재현한 프로그램에 대한 데이터를 저장하는 메모리(미도시), 및 메모리에 저장된 데이터를 이용하여 전술한 동작을 수행하는 프로세서(미도시)로 구현될 수 있다. 이때, 메모리와 프로세서는 각각 별개의 칩으로 구현될 수 있다. 또는, 메모리와 프로세서는 단일 칩으로 구현될 수도 있다.On the other hand, the control unit performs an operation described above using a memory (not shown) that stores data for an algorithm or a program reproducing the algorithm for controlling the operation of components in the vehicle 1 and data stored in the memory. It may be implemented as a processor (not shown). At this time, the memory and the processor may be implemented as separate chips, respectively. Alternatively, the memory and the processor may be implemented as a single chip.

저장부(140)는 수신된 단말기(2)의 폰북 정보, 통화 내역 정보, 사용자 패턴 등의 다양한 정보를 저장할 수 있다. The storage unit 140 may store various information such as phone book information, call history information, and user patterns of the received terminal 2.

또한, 저장부(140)는 음향 모델, 언어 모델, 단어 정보 등의 음성 인식과 관련된 다양한 정보를 저장할 수 있다. Also, the storage unit 140 may store various information related to speech recognition, such as a sound model, a language model, and word information.

이를 위해, 저장부(140)는 캐쉬, ROM(Read Only Memory), PROM(Programmable ROM), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM) 및 플래쉬 메모리(Flash memory)와 같은 비휘발성 메모리 소자 또는 RAM(Random Access Memory)과 같은 휘발성 메모리 소자 또는 하드디스크 드라이브(HDD, Hard Disk Drive), CD-ROM과 같은 저장 매체 중 적어도 하나로 구현될 수 있으나 이에 한정되지는 않는다. 저장부는 제어부(130)와 관련하여 전술한 프로세서와 별개의 칩으로 구현된 메모리일 수 있고, 프로세서와 단일 칩으로 구현될 수도 있다.To this end, the storage unit 140 is a non-volatile memory such as cache, read only memory (ROM), programmable ROM (PROM), erasable programmable ROM (EPROM), electrically erasable programmable ROM (EPMROM), and flash memory The device may be implemented as at least one of a volatile memory device such as a random access memory (RAM) or a storage medium such as a hard disk drive (HDD) or CD-ROM, but is not limited thereto. The storage unit may be a memory implemented in a separate chip from the above-described processor in relation to the controller 130, or may be implemented in a single chip from the processor.

도 1에 도시된 차량(1)의 구성 요소들의 성능에 대응하여 적어도 하나의 구성요소가 추가되거나 삭제될 수 있다. 또한, 구성 요소들의 상호 위치는 시스템의 성능 또는 구조에 대응하여 변경될 수 있다는 것은 당해 기술 분야에서 통상의 지식을 가진 자에게 용이하게 이해될 것이다.At least one component may be added or deleted in response to the performance of the components of the vehicle 1 shown in FIG. 1. In addition, it will be readily understood by those skilled in the art that the mutual positions of the components may be changed corresponding to the performance or structure of the system.

한편, 도 1에서 도시된 각각의 구성요소는 소프트웨어 및/또는 Field Programmable Gate Array(FPGA) 및 주문형 반도체(ASIC, Application Specific Integrated Circuit)와 같은 하드웨어 구성요소를 의미한다.Meanwhile, each component illustrated in FIG. 1 refers to software and / or hardware components such as a field programmable gate array (FPGA) and an application specific integrated circuit (ASIC).

이하, 구체적인 제어부(130)의 동작에 관하여 상세히 설명한다.Hereinafter, the operation of the specific control unit 130 will be described in detail.

도 3은 일 실시예에 따른 제어부의 동작을 설명하기 위한 도면이다.3 is a view for explaining the operation of the control unit according to an embodiment.

도 3을 참조하면, 일 실시예에 따른 제어부(130)는 음성 입력부(110)로부터 수신된 입력 신호에 대한 노이즈 제거를 수행하는 전처리부(131), 입력된 사용자의 음성을 인식하여 텍스트 형태의 발화문을 출력하는 음성 인식부(132), 인식 결과 중 사용자의 음성에 대응하는 이름을 선택하는 후처리부(133)를 포함할 수 있다. Referring to FIG. 3, the control unit 130 according to an embodiment of the present invention is a pre-processing unit 131 performing noise removal on an input signal received from the voice input unit 110, and recognizes the input user's voice in text form. It may include a voice recognition unit 132 for outputting the speech, and a post-processing unit 133 for selecting a name corresponding to the user's voice among the recognition results.

전처리부(131)는 음성 입력부(110)로부터 수신된 입력 신호에 대하여 노이즈 제거를 수행할 수 있다. 또한, 전처리부(131)는 신호 증폭 등의 다양한 신호 처리를 통하여 입력 신호에서 잡음을 제거하는 노이즈 제거를 수행할 수 있다. The pre-processing unit 131 may perform noise removal on the input signal received from the voice input unit 110. Also, the pre-processing unit 131 may perform noise removal to remove noise from the input signal through various signal processing such as signal amplification.

또한, 전처리부(131)는 음성 입력부(110)로부터 전달되는 입력 신호를 모니터링하여 사용자의 음성이 입력되는지 여부를 판단할 수 있다. In addition, the pre-processing unit 131 may monitor the input signal transmitted from the voice input unit 110 to determine whether a user's voice is input.

기존에는 사용자가 음성을 입력하기 위해 PTT(Push to Talk) 버튼을 조작하여 마이크를 오픈하거나, 음성 인식을 활성화시키기 위한 별도의 명령어를 발화하는 등의 트리거 신호를 입력해야 했다. 그러나, 일 실시예에 따른 차량(1)에서는 음성 입력부(110)가 상시 오픈되어 있고, 음성 입력부(110)를 통해 입력되는 신호를 전처리부(131)가 실시간으로 모니터링하여 사용자의 음성 입력 여부를 판단할 수 있다. Previously, the user had to input a trigger signal, such as opening a microphone by operating a Push to Talk (PTT) button to input voice, or uttering a separate command to activate voice recognition. However, in the vehicle 1 according to an embodiment, the voice input unit 110 is always open, and the pre-processing unit 131 monitors the signal input through the voice input unit 110 in real time to determine whether a user inputs voice. I can judge.

사용자의 음성이 입력된 것으로 판단하면, 전처리부(131)는 입력된 신호에 대한 노이즈 제거를 수행할 수 있고, 이러한 신호 처리된 음성 신호를 음성 인식부(132)로 전달할 수 있다.If it is determined that the user's voice is input, the pre-processing unit 131 may perform noise removal on the input signal, and may transmit the signal-processed voice signal to the voice recognition unit 132.

음성 인식부(132)는 입력된 음성 신호로부터 사용자가 발화한 음성을 인식할 수 있고, 그 인식 결과를 출력할 수 있다. 음성 인식부(132)에서 출력되는 인식 결과는 텍스트 형태의 발화문일 수 있다. The voice recognition unit 132 may recognize the voice uttered by the user from the input voice signal, and output the recognition result. The recognition result output from the speech recognition unit 132 may be a text-like speech.

이를 위해, 음성 인식부(132)는 음성 인식 엔진(speech recognition engine)을 포함할 수 있고, 음성 인식 엔진은 입력된 음성에 음성 인식 알고리즘을 적용하여 사용자가 발화한 음성을 인식하고, 인식 결과를 생성할 수 있다. To this end, the speech recognition unit 132 may include a speech recognition engine, and the speech recognition engine recognizes speech uttered by the user by applying a speech recognition algorithm to the input speech, and recognizes the recognition result. Can be created.

음성 인식부(132)는 음성의 신호적인 특성을 모델링하여 비교하는 음향 모델(Acoustic Model) 과 인식 어휘에 해당하는 단어나 음절 등의 언어적인 순서 관계를 모델링하는 언어 모델(Language Model)을 이용할 수 있다. 이를 위해, 저장부(140)에는 음향 모델/언어 모델 DB(141, 142)가 저장될 수 있다.The speech recognition unit 132 may use an acoustic model for modeling and comparing signal characteristics of speech and a language model for modeling linguistic order relationships such as words or syllables corresponding to the recognized vocabulary. have. To this end, the acoustic model / language model DB 141 or 142 may be stored in the storage 140.

한편, 단어나 음절 등의 언어적인 순서 관계를 모델링하는 언어 모델은 언어를 구성하는 단위들 간의 순서 관계를 음성 인식에서 얻어진 단위들에 적용함으로써 음향적인 모호성을 줄이고 인식의 오류를 줄일 수 있다. 언어 모델에는 통계적 언어 모델과 유한 상태 네트워크(Finite State Automata: FSA)에 기반한 모델이 있고, 통계적 언어 모델에는 Unigram, Bigram, Trigram 등 단어의 연쇄 확률이 이용된다. On the other hand, a language model that models a linguistic order relationship such as a word or a syllable can reduce acoustic ambiguity and reduce errors in recognition by applying the order relationship between units constituting language to units obtained in speech recognition. The language model includes a statistical language model and a model based on a Finite State Automata (FSA), and the statistical language model uses chain probabilities of words such as Unigram, Bigram, and Trigram.

음성 인식부(132)는 음성을 인식함에 있어 상술한 방식 중 어느 방식을 사용해도 무방하다. 예를 들어, 히든 마르코프 모델이 적용된 음향 모델을 사용할 수도 있고, 음향 모델과 음성 모델을 통합한 N-best 탐색법을 사용할 수 있다. N-best 탐색법은 음향 모델과 언어 모델을 이용하여 N개까지의 인식 결과 후보를 검색한 후, 이들 후보의 순위를 재평가함으로써 인식 성능을 향상시킬 수 있다.The voice recognition unit 132 may use any of the above-described methods in recognizing voice. For example, an acoustic model to which the Hidden Markov model is applied may be used, or an N-best search method incorporating an acoustic model and a voice model may be used. The N-best search method can improve recognition performance by retrieving the ranks of the candidates after retrieving up to N recognition result candidates using the acoustic model and the language model.

음성 인식부(132)는 인식 결과의 신뢰성을 확보하기 위해 신뢰도 점수(confidence score)를 계산할 수 있다. 신뢰도 점수는 음성 인식 결과에 대해서 그 결과를 얼마나 믿을 만한 것인가를 나타내는 척도이다. 일 예로, 인식된 결과인 음소나 단어에 대해서, 그 외의 다른 음소나 단어로부터 그 말이 발화되었을 확률에 대한 상대값으로 정의할 수 있다. 따라서, 신뢰도 점수는 0 에서 1 사이의 값으로 표현할 수도 있고, 0 에서 10000 사이의 값으로 표현할 수도 있으며, 이에 한정되지 않는다.The voice recognition unit 132 may calculate a confidence score to secure the reliability of the recognition result. The reliability score is a measure of how reliable the results of speech recognition are. For example, a phoneme or word that is a recognized result may be defined as a relative value for the probability that the word is spoken from other phonemes or words. Accordingly, the reliability score may be expressed as a value between 0 and 1, and may be expressed as a value between 0 and 10000, but is not limited thereto.

또한, 음성 인식부(132)는 사용자의 음성으로부터 출력된 텍스트 형태의 발화문으로부터 이름을 추출할 수 있다. 이 경우, 음성 인식부(132)는 사용자의 음성에 대응하는 이름에 대한 적어도 하나의 이름 후보를 검색할 수 있으며, 인식 결과는 적어도 하나의 이름 후보를 포함할 수 있다. 또한, 적어도 하나의 이름 후보에 대한 신뢰도 점수를 더 포함할 수 있다. In addition, the voice recognition unit 132 may extract a name from the text-type speech output from the user's voice. In this case, the voice recognition unit 132 may search for at least one name candidate for a name corresponding to the user's voice, and the recognition result may include at least one name candidate. In addition, a reliability score for at least one name candidate may be further included.

예를 들어, 전술한 N-best 탐색법을 이용하는 경우, 음성 인식부(132)는 N개까지의 이름 후보를 검색할 수 있다. 음성 인식부(132)는 N개의 이름 후보의 순위를 평가함으로써 인식 결과를 출력할 수 있고, N개의 이름 후보에 대하여 신뢰도 점수를 산출할 수 있다.For example, when using the N-best search method described above, the voice recognition unit 132 may search up to N name candidates. The voice recognition unit 132 may output the recognition result by evaluating the rank of the N name candidates, and calculate a reliability score for the N name candidates.

이러한 음성 인식부(132)에 의해 생성된 인식 결과는 후처리부(133)으로 전달될 수 있다. 후처리부(133)는 인식 결과 중 사용자의 음성에 대응하는 이름을 선택할 수 있고, 선택된 이름에 대한 다양한 제어 명령을 단말기(2)로 전송하도록 통신부(120)를 제어할 수 있다. The recognition result generated by the speech recognition unit 132 may be transmitted to the post-processing unit 133. The post-processing unit 133 may select a name corresponding to the user's voice among the recognition results, and may control the communication unit 120 to transmit various control commands for the selected name to the terminal 2.

예를 들어, 후처리부(133)는 사용자의 음성에 대응하는 이름에 대한 통화 발신 명령을 단말기(2)로 전송하도록 통신부(120)를 제어할 수 있다. 후처리부(133)는 사용자의 음성에 대응하는 이름과 매칭된 전화번호를 함께 전송할 수 있으며, 통신부(120)를 통하여 해당 이름에 대한 통화 발신 명령을 단말기(2)로 전송할 수 있다.For example, the post-processing unit 133 may control the communication unit 120 to transmit a call originating command for the name corresponding to the user's voice to the terminal 2. The post-processing unit 133 may transmit a phone number matching the name corresponding to the user's voice, and may transmit a call originating command for the name to the terminal 2 through the communication unit 120.

이를 위해, 후처리부(133)는 인식 결과에 포함된 적어도 하나의 이름 후보 중 사용자의 음성에 대응하는 이름을 선택할 수 있다. To this end, the post-processing unit 133 may select a name corresponding to the user's voice among at least one name candidate included in the recognition result.

구체적으로, 후처리부(153)는 인식 결과에 포함된 적어도 하나의 이름 후보 중 사용자의 음성에 대응하는 이름을 미리 설정된 임계값에 기초하여 선택할 수 있다. 이 때, 미리 설정된 임계값은 인식 결과에 대한 신뢰도 점수에 대한 임계값을 의미하며, 적어도 하나일 수 있다. Specifically, the post-processing unit 153 may select a name corresponding to the user's voice among at least one name candidate included in the recognition result based on a preset threshold. At this time, the preset threshold value means a threshold value for the reliability score for the recognition result, and may be at least one.

후처리부(133)는 이러한 적어도 하나의 임계값을 신뢰도 점수 DB(144)에 저장할 수 있고, 인식 결과에 대한 임계값을 이름 또는 음성을 입력한 사용자별로 저장할 수도 있다. The post-processing unit 133 may store the at least one threshold value in the reliability score DB 144, and may store the threshold value for the recognition result for each user who has entered a name or voice.

후처리부(133)는 신뢰도 점수가 미리 설정된 제1임계값(threshold)을 초과하는 이름 후보 중에서 사용자의 음성에 대응하는 이름을 선택함으로써 선택된 이름에 대한 동작이 수행되도록 할 수 있다. 이 때, 제1임계값은 인식 결과에 대한 최소한의 신뢰성을 보장하는 신뢰도 점수를 의미할 수 있다.The post-processing unit 133 may select a name corresponding to the user's voice from among name candidates whose reliability score exceeds a preset first threshold, so that an operation on the selected name is performed. In this case, the first threshold value may mean a reliability score that guarantees minimum reliability for the recognition result.

후처리부(133)는 인식 결과에 포함된 적어도 하나의 이름 후보 중 신뢰도가 미리 설정된 제1임계값을 초과하는 이름 후보가 존재하지 않으면, 인식 결과에 대한 신뢰성을 보장할 수 없으므로 인식 결과를 거절(rejection)할 수 있다. 즉, 인식 실패를 확인할 수 있다. 이 경우, 후처리부(133)는 사용자에게 음성을 다시 입력할 것을 디스플레이(152) 또는 스피커(151)를 통하여 요청할 수 있다. The post-processing unit 133 rejects the recognition result because it cannot guarantee the reliability of the recognition result if there is no name candidate whose reliability exceeds a preset first threshold among at least one name candidate included in the recognition result ( rejection). That is, the recognition failure can be confirmed. In this case, the post-processing unit 133 may request the user to input the voice again through the display 152 or the speaker 151.

또한, 후처리부(133)는 인식 결과에 포함된 적어도 하나의 이름 후보 중 신뢰도가 미리 설정된 제1임계값을 초과하는 이름 후보가 1개인 경우, 해당 이름 후보의 신뢰도 점수가 제2임계값을 초과하는지 여부를 판단할 수 있고, 판단 결과에 기초하여 사용자의 음성에 대응하는 이름을 선택할 수 있다. In addition, the post-processing unit 133, when there is one name candidate that exceeds the first predetermined threshold among the at least one name candidate included in the recognition result, the reliability score of the corresponding name candidate exceeds the second threshold. It is possible to determine whether or not, and a name corresponding to the user's voice can be selected based on the determination result.

이 때, 제2임계값은 인식 결과에 대한 최대한의 신뢰성을 보장할 수 있는 신뢰도 점수를 의미할 수 있고, 제1임계값보다 클 수 있다.At this time, the second threshold value may mean a reliability score capable of ensuring maximum reliability of the recognition result, and may be greater than the first threshold value.

구체적으로, 후처리부(133)는 신뢰도가 제1임계값을 초과하는 이름 후보의 신뢰도 점수가 제2임계값을 초과하면, 높은 신뢰성을 보장하는 경우에 해당하므로, 해당 이름 후보를 입력된 음성에 대응하는 이름으로 선택할 수 있다. Specifically, since the post-processing unit 133 guarantees high reliability when the reliability score of a name candidate whose reliability exceeds the first threshold value exceeds the second threshold value, the post-processing unit 133 applies the name candidate to the input voice. You can choose the corresponding name.

또는, 후처리부(133)는 신뢰도가 제1임계값을 초과하는 이름 후보의 신뢰도 점수가 제2임계값 이하인 경우, 높은 신뢰성을 보장하는 경우에 해당한다고 볼 수 없으므로, 해당 이름 후보에 대한 확인을 사용자에게 시각적 또는 청각적으로 요청할 수 있다. Alternatively, the post-processing unit 133 cannot confirm that the reliability of the name candidate whose reliability exceeds the first threshold is less than the second threshold, so that it does not correspond to the case where high reliability is guaranteed, so check the name candidate. The user can make a visual or audible request.

이를 위해, 후처리부(133)는 해당 이름 후보에 관한 정보에 대한 확인을 사용자에게 요청하도록 디스플레이(152) 또는 스피커(151)를 제어할 수 있고, 사용자로부터 해당 이름 후보에 대한 확인이 이루어지는 경우, 확인된 이름 후보를 사용자 음성에 대응하는 이름으로 선택할 수 있다.To this end, the post-processing unit 133 may control the display 152 or the speaker 151 to request the user to confirm information regarding the name candidate, and when the user checks the name candidate, The identified name candidate can be selected as a name corresponding to the user's voice.

신뢰도 점수가 제1임계값을 초과하는 이름 후보의 개수가 복수개인 경우, 후처리부(133)는 복수개의 이름 후보의 우선 순위를 신뢰도 점수에 기초하여 결정할 수 있다. 후처리부(133)는 결정된 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이와 제3임계값을 비교할 수 있고, 비교 결과에 기초하여 사용자의 음성에 대응하는 이름을 선택할 수 있다.When the number of name candidates whose reliability score exceeds the first threshold value is plural, the post-processing unit 133 may determine the priority of the plurality of name candidates based on the reliability score. The post-processing unit 133 may compare the difference in the reliability score between the name candidate having the first priority and the name candidate having the second priority and the third threshold, and corresponding to the user's voice based on the comparison result You can choose a name.

이 때, 제3임계값은 인식 결과 간의 신뢰도 점수의 차이에 대한 신뢰성을 보장하는 임계값을 의미할 수 있고, 제 1 임계값 및 제2임계값 보다 작은 신뢰도 점수를 갖는 임계값일 수 있다.In this case, the third threshold value may mean a threshold value that guarantees reliability of the difference in the reliability score between the recognition results, and may be a threshold value having a reliability score smaller than the first threshold value and the second threshold value.

우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이가 제3임계값을 초과하는 경우, 제1순위인 이름 후보에 대한 신뢰성이 보장되므로, 후처리부(133)는 우선 순위가 제1순위인 이름 후보를 사용자의 음성에 대응하는 이름으로 선택할 수 있다. When the difference in the reliability score between the first-ranked name candidate and the second-ranked name candidate exceeds the third threshold, since the reliability of the first-ranked name candidate is guaranteed, the post-processing unit 133 May select a name candidate whose priority is the first priority as a name corresponding to the user's voice.

또는, 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이가 제3임계값 이하인 경우, 제1순위인 이름 후보에 대한 신뢰성이 보장되지 않는 바, 후처리부(133)는 우선 순위가 제1순위인 이름 후보에 대한 확인을 사용자에게 시각적 또는 청각적으로 요청할 수 있다. Alternatively, when the difference in the reliability score between the first-ranked name candidate and the second-ranked name candidate is less than or equal to the third threshold, reliability of the first-ranked name candidate is not guaranteed. 133) may visually or audibly request the user to confirm the name candidate whose priority is the first priority.

다시 말해, 후처리부(133)는 우선 순위가 제1순위인 이름 후보를 곧바로 사용자의 음성에 대응하는 이름으로 선택하지 않고, 사용자에게 확인을 요청함으로써, 사용자로부터 확인이 이루어지는 경우에만 제1순위인 이름 후보를 사용자 음성에 대응하는 이름으로 선택할 수 있다. In other words, the post-processing unit 133 does not immediately select the name candidate having the first priority as a name corresponding to the user's voice, but requests the user to confirm, so that the first priority is only when confirmation is made from the user. The name candidate can be selected as a name corresponding to the user's voice.

또한, 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이가 제3임계값 이하인 경우, 후처리부(133)는 제1순위인 이름 후보에 대한 카테고리가 복수개인지 여부를 확인할 수 있다. In addition, when the difference in the reliability score between the first-ranked name candidate and the second-ranked name candidate is less than or equal to the third threshold, the post-processing unit 133 determines whether there are multiple categories for the first-ranked name candidate. Can be checked.

이 때, 제1순위인 이름 후보에 대한 카테고리가 복수개가 아닌 경우, 즉 제1순위인 이름 후보가 하나의 카테고리만을 포함하는 경우, 후처리부(133)는 우선 순위가 제1순위인 이름 후보에 대한 확인을 사용자에게 시각적 또는 청각적으로 요청할 수 있다. At this time, if there are not a plurality of categories for the first name candidate, that is, if the first name candidate includes only one category, the post-processing unit 133 is assigned to the first priority name candidate. You can ask the user for a confirmation, either visually or audibly.

즉, 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이가 제3임계값 이하인 경우는 제1순위인 이름 후보에 대한 신뢰성이 보장되지 않는 경우이므로, 후처리부(133)는 우선 순위가 제1순위인 이름 후보를 곧바로 사용자의 음성에 대응하는 이름으로 선택하지 않고, 사용자에게 확인을 요청할 수 있다. 후처리부(133)는 사용자로부터 확인이 이루어지는 경우에만 제1순위인 이름 후보를 사용자 음성에 대응하는 이름으로 선택함으로써 음성 인식의 정확도를 높일 수 있다.That is, when the difference in the reliability score between the first-ranked name candidate and the second-ranked name candidate is less than or equal to the third threshold, since the reliability of the first-ranked name candidate is not guaranteed, the post-processing unit In step 133, the name candidate whose priority is the first priority may not be selected as a name corresponding to the user's voice, and the user may be asked to confirm. The post-processing unit 133 may increase the accuracy of speech recognition by selecting a name candidate that is the first priority as a name corresponding to the user's voice only when confirmation is made from the user.

제1순위인 이름 후보에 대한 카테고리가 복수개인 경우, 즉 제1순위인 이름 후보가 복수개의 카테고리만을 포함하는 경우, 후처리부(133)는 저장된 사용자 패턴에 기초하여 복수개의 카테고리 각각의 확률값을 결정할 수 있다. If there are multiple categories for the first name candidate, that is, the first name candidate includes only a plurality of categories, the post-processing unit 133 determines the probability value of each of the plurality of categories based on the stored user pattern. Can be.

이 때, 후처리부(133)는 사용자 패턴의 이름별 카테고리에 대한 발신 시간 또는 이름별 카테고리에 대한 수신 시간 중 적어도 하나에 기초하여 복수개의 카테고리 각각의 확률값을 결정할 수 있다. In this case, the post-processing unit 133 may determine a probability value of each of the plurality of categories based on at least one of a transmission time for a category by name of a user pattern or a reception time for a category by name.

후처리부(133)는 복수개의 카테고리별 확률값에 기초하여 최대 확률값을 갖는 카테고리를 선택할 수 있으며, 선택된 카테고리의 확률값이 미리 정해진 신뢰도 점수를 초과하는지 여부를 확인할 수 있다.The post-processing unit 133 may select a category having a maximum probability value based on a plurality of category-specific probability values, and check whether the probability value of the selected category exceeds a predetermined reliability score.

선택된 카테고리의 확률값이 미리 정해진 신뢰도 점수를 초과하면, 후처리부(133)는 선택된 카테고리에 대한 제어를 수행할 수 있다. 즉, 후처리부(133)는 제1순위 이름 후보에 대한 선택된 카테고리에 매칭되는 전화 번호에 대한 통화 발신 명령을 전송할 수 있다. When the probability value of the selected category exceeds a predetermined reliability score, the post-processing unit 133 may perform control for the selected category. That is, the post-processing unit 133 may transmit a call originating command for a phone number matching the selected category for the first rank name candidate.

이 경우, 후처리부(133)는 사용자 개인의 통화 특성을 반영한 사용자 패턴을 이용하므로, 보다 정확한 통화 발신 명령을 전송할 수 있다. 따라서, 음성 인식을 이용한 통화 기능을 제공함에 있어서, 보다 정확한 통화 기능 제공이 가능할 수 있으므로, 사용성 및 편의성이 증대될 수 있다. In this case, since the post-processing unit 133 uses a user pattern reflecting the call characteristics of the user, a more accurate call originating command can be transmitted. Therefore, in providing a call function using voice recognition, since a more accurate call function may be provided, usability and convenience may be increased.

또는, 선택된 카테고리의 확률값이 미리 정해진 신뢰도 점수 이하이면, 후처리부(133)는 사용자에게 카테고리에 대한 선택을 요청할 수 있다. 이 경우, 후처리부(133)는 선택된 카테고리에 대한 제어를 바로 수행하지 않고, 미리 정해진 개수의 카테고리 후보를 사용자에게 표시함으로써 사용자에게 카테고리에 대한 선택을 요청할 수 있다.Alternatively, if the probability value of the selected category is equal to or less than a predetermined reliability score, the post-processing unit 133 may request the user to select a category. In this case, the post-processing unit 133 may request the user to select a category by displaying a predetermined number of category candidates to the user without directly controlling the selected category.

이후, 사용자로부터 카테고리의 선택이 수신되면, 후처리부(133)는 선택된 카테고리에 대한 제어를 수행할 수 있다. 즉, 후처리부(133)는 제1순위 이름 후보에 대한 선택된 카테고리에 매칭되는 전화 번호에 대한 통화 발신 명령을 전송할 수 있다. Thereafter, when a selection of a category is received from the user, the post-processing unit 133 may perform control for the selected category. That is, the post-processing unit 133 may transmit a call originating command for a phone number matching the selected category for the first rank name candidate.

이를 통해, 보다 정확한 사용자 음성 인식 기능이 제공될 수 있고, 사용자의 음성 인식 성공률이 높아지므로 사용자의 편의성이 증대될 수 있다. Through this, a more accurate user voice recognition function may be provided, and a user's convenience may be increased because a user's voice recognition success rate is increased.

또한, 후처리부(133)는 미리 정해진 임계값을 변경할 수 있다. 구체적으로, 후처리부(133)는 사용자의 통화 패턴에 관한 사용자 패턴에 기초하여 적어도 하나의 임계값을 결정할 수 있다.In addition, the post-processing unit 133 may change a predetermined threshold value. Specifically, the post-processing unit 133 may determine at least one threshold value based on the user pattern related to the user's call pattern.

이를 위해, 후처리부(133)는 단말기의 폰북 정보 및 통화 내역 정보에 기초하여 사용자 패턴을 생성할 수 있고, 사용자 패턴 DB(143)에 저장할 수 있다.To this end, the post-processing unit 133 may generate a user pattern based on the phonebook information and call history information of the terminal, and may store the user pattern in the user pattern DB 143.

구체적으로, 후처리부(133)는 폰북 정보 및 통화 내역 정보에 기초하여 사용자의 통화 내역의 특징을 파악하기 위해 필요한 정보들을 추출 또는 수집함으로써 사용자 패턴을 생성할 수 있다. Specifically, the post-processing unit 133 may generate a user pattern by extracting or collecting information necessary to understand the characteristics of the user's call history based on the phonebook information and the call history information.

이 때, 사용자 패턴은 사용자의 통화 패턴에 관한 정보를 의미하며, 구체적으로 시간별 사용자의 통화 내역의 특징 정보를 의미할 수 있다. 사용자 패턴은 폰북 정보의 이름, 이름별 카테고리, 이름별 통화 횟수, 이름별 발신 시간, 이름별 수신 시간, 이름별 카테고리에 대한 발신 시간, 이름별 카테고리에 대한 수신 시간 등을 포함할 수 있다. 이 외에도 사용자 패턴은 이름별 신뢰도 점수(confidence score), 이름별 신뢰도 점수에 대한 적어도 하나의 임계값, 이름별 추천된 액션 및 이름별 추천된 액션의 수행 여부 등의 사용자의 통화 패턴을 판단하기 위하여 필요한 다양한 정보들을 포함할 수 있다.At this time, the user pattern refers to information on the user's call pattern, and may specifically refer to feature information of the user's call history by time. The user pattern may include the name of the phonebook information, a category by name, a number of calls by name, a transmission time by name, a reception time by name, a transmission time for a category by name, and a reception time for a category by name. In addition, the user pattern is used to determine a user's call pattern, such as whether a confidence score for each name, a confidence score for each name, at least one threshold value for each name, a recommended action by name, and a recommended action by name are performed. It may contain various information needed.

또한, 후처리부(133)는 단말기(2)의 폰북 정보 중 사용자의 음성에 대응하는 적어도 하나의 이름 후보를 검색할 수 있고, 검색된 이름 후보의 개수에 기초하여 적어도 하나의 임계값을 변경할 수 있다. 즉, 후처리부(133)는 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경할 수 있다. Further, the post-processing unit 133 may search for at least one name candidate corresponding to the user's voice among the phonebook information of the terminal 2, and may change at least one threshold value based on the number of searched name candidates. . That is, the post-processing unit 133 may change at least one of the first threshold value, the second threshold value, or the third threshold value.

구체적으로, 검색된 이름 후보의 개수가 미리 정해진 제1기준 개수 이하인 경우, 후처리부(133)는 제2임계값을 증가시킬 수 있다. 검색된 이름 후보의 개수가 미리 정해진 제1기준 개수 이하인 경우는 폰북에 비슷한 이름이 없다는 의미일 수 있다. 이 경우, 폰북에 비슷한 이름이 많은 경우 보다 사용자의 음성에 대응하는 정확한 이름이 검색될 확률이 높아질 수 있다. 즉, 인식률이 높은 환경일 수 있다. 따라서, 후처리부(133)는 제2임계값을 증가시킴으로써 인식 결과에 포함된 이름 후보의 개수를 줄일 수 있고, 선택된 이름에 대한 제어가 바로 수행될 수 있도록 할 수 있다. 따라서, 사용자의 사용성이 증대될 수 있다. Specifically, when the number of searched name candidates is equal to or less than the predetermined first reference number, the post-processing unit 133 may increase the second threshold value. If the number of searched name candidates is less than or equal to a predetermined first reference number, it may mean that there is no similar name in the phone book. In this case, the probability that an exact name corresponding to the user's voice is searched may be higher than if there are many similar names in the phone book. That is, it may be an environment with a high recognition rate. Accordingly, the post-processing unit 133 may reduce the number of name candidates included in the recognition result by increasing the second threshold value, and control the selected name to be performed immediately. Therefore, user usability can be increased.

또한, 검색된 이름 후보의 개수가 미리 정해진 제1기준 개수 이하인 경우, 후처리부(133)는 제3임계값을 감소시킬 수 있다. 이 경우, 인식 결과 사이에 대한 신뢰도 점수 차이가 작은 경우에도 사용자에 대한 확인 요청 없이 제1순위인 이름 후보를 선택할 수 있으므로, 사용자의 사용성이 증대될 수 있다.In addition, when the number of searched name candidates is equal to or less than the predetermined first reference number, the post-processing unit 133 may decrease the third threshold value. In this case, even if the difference in the reliability score between the recognition results is small, since the first candidate name can be selected without requesting confirmation to the user, the user's usability can be increased.

또한, 검색된 이름 후보의 개수가 미리 정해진 제1기준 개수를 초과하는 경우, 후처리부(133)는 제1임계값 또는 제2임계값 중 적어도 하나를 감소시킬 수 있다. 검색된 이름 후보의 개수가 미리 정해진 제1기준 개수를 초과하는 경우는 폰북에 비슷한 이름이 많다는 의미일 수 있다. 이 경우, 폰북에 비슷한 이름이 적은 경우 보다 사용자의 음성에 대응하는 정확한 이름이 검색될 확률이 낮아질 수 있다. 즉, 인식율이 낮은 환경일 수 있다.In addition, when the number of searched name candidates exceeds a predetermined first reference number, the post-processing unit 133 may decrease at least one of the first threshold value or the second threshold value. When the number of searched name candidates exceeds a predetermined first reference number, it may mean that there are many similar names in the phone book. In this case, the probability that an accurate name corresponding to a user's voice is searched may be lower than when there are few similar names in the phone book. That is, it may be an environment with low recognition rate.

따라서, 후처리부(133)는 제1임계값 또는 제2임계값 중 적어도 하나를 감소시킴으로써 인식 결과에 포함된 이름 후보의 개수를 늘릴 수 있고, 선택된 이름에 대한 제어가 바로 수행되지 않도록 할 수 있다. 따라서, 음성 인식의 정확성 및 인식률이 증대될 수 있다.Accordingly, the post-processing unit 133 may increase the number of name candidates included in the recognition result by reducing at least one of the first threshold value or the second threshold value, and prevent control of the selected name from being performed immediately. . Therefore, the accuracy and recognition rate of speech recognition can be increased.

또한, 검색된 이름 후보의 개수가 미리 정해진 제1기준 개수를 초과하는 경우, 후처리부(133)는 제3임계값을 증가시킬 수 있다. 이 경우, 인식 결과 사이에 대한 신뢰도 점수 차이가 큰 경우에도 사용자에 대한 확인 요청이 이루어지므로, 음성 인식의 정확성 및 인식률이 증대될 수 있다.In addition, when the number of searched name candidates exceeds a predetermined first reference number, the post-processing unit 133 may increase the third threshold value. In this case, even if the difference in the reliability score between the recognition results is large, a request for confirmation is made to the user, so the accuracy and recognition rate of speech recognition may be increased.

또한, 후처리부(133)는 단말기(2)의 폰북 정보로부터 검색된 이름 후보에 대한 카테고리의 개수를 확인할 수 있고, 확인된 카테고리의 개수에 기초하여 적어도 하나의 임계값을 변경할 수 있다. In addition, the post-processing unit 133 may check the number of categories for the name candidates retrieved from the phonebook information of the terminal 2, and may change at least one threshold value based on the number of confirmed categories.

구체적으로, 검색된 이름 후보에 대한 카테고리의 개수가 미리 정해진 제2기준 개수 이하인 경우, 후처리부(133)는 제1임계값 또는 제2임계값 중 적어도 하나를 증가시킬 수 있다. Specifically, when the number of categories for the searched name candidate is less than or equal to a predetermined second reference number, the post-processing unit 133 may increase at least one of the first threshold value or the second threshold value.

검색된 이름 후보에 대한 카테고리의 개수가 미리 정해진 제2기준 개수 이하인 경우는 이름에 매칭되는 전화번호 종류가 적다는 의미일 수 있다. 이 경우, 이름에 매칭되는 전화번호 종류가 많은 경우 보다 사용자의 요구에 부합하는 기능을 제공할 확률이 높아질 수 있다. 즉, 인식율이 높은 환경일 수 있다. When the number of categories for the searched name candidate is less than or equal to the predetermined second reference number, it may mean that the number of phone numbers matching the name is small. In this case, the probability of providing a function that meets the needs of the user may be higher than when there are many types of phone numbers matching the name. That is, it may be an environment with a high recognition rate.

따라서, 후처리부(133)는 제1임계값 또는 제2임계값 중 적어도 하나를 증가시킴으로써 인식 결과에 포함된 이름 후보의 개수를 줄일 수 있고, 선택된 이름에 대한 제어가 바로 수행될 수 있도록 할 수 있다. 따라서, 사용자의 편의성이 증대될 수 있다. Therefore, the post-processing unit 133 may reduce the number of name candidates included in the recognition result by increasing at least one of the first threshold value or the second threshold value, and allow control of the selected name to be performed immediately. have. Therefore, user convenience may be increased.

또한, 검색된 이름 후보에 대한 카테고리의 개수가 미리 정해진 제2기준 개수 이하인 경우, 후처리부(133)는 제3임계값을 감소시킬 수 있다. 이 경우, 인식 결과 사이에 대한 신뢰도 점수 차이가 작은 경우에도 사용자에 대한 확인 요청 없이 제1순위인 이름 후보를 선택할 수 있으므로, 사용자의 편의성이 증대될 수 있다.In addition, when the number of categories for the searched name candidate is less than or equal to a predetermined second reference number, the post-processing unit 133 may decrease the third threshold value. In this case, even if the difference in the reliability score between the recognition results is small, the user can select the first name candidate without the user's request for confirmation, thereby increasing user convenience.

또는, 검색된 이름 후보에 대한 카테고리의 개수가 미리 정해진 제2기준 개수를 초과하는 경우, 후처리부(133)는 제1임계값 또는 제2임계값 중 적어도 하나를 감소시킬 수 있다. Alternatively, when the number of categories for the searched name candidate exceeds a predetermined second reference number, the post-processing unit 133 may decrease at least one of the first threshold value or the second threshold value.

검색된 이름 후보에 대한 카테고리의 개수가 미리 정해진 제2기준 개수를 초과하는 경우는 이름에 매칭되는 전화번호 종류가 많다는 의미일 수 있다. 이 경우, 이름에 매칭되는 전화번호 종류가 적은 경우 보다 사용자의 요구에 부합하는 기능을 제공할 확률이 낮아질 수 있다. 즉, 인식율이 낮은 환경일 수 있다. When the number of categories for the searched name candidate exceeds a predetermined second reference number, it may mean that there are many types of phone numbers matching the name. In this case, the probability of providing a function that meets the user's needs may be lower than when the number of phone numbers matching the name is small. That is, it may be an environment with low recognition rate.

따라서, 후처리부(133)는 제1임계값 또는 제2임계값 중 적어도 하나를 감소시킴으로써 인식 결과에 포함된 이름 후보의 개수를 늘릴 수 있다. 후처리부(133)는 선택된 이름에 대한 제어가 바로 수행되지 않고, 사용자의 확인 요청이 이루어지도록 함으로써 음성 인식의 정확성 및 인식률을 증대시킬 수 있다. Accordingly, the post-processing unit 133 may increase the number of name candidates included in the recognition result by reducing at least one of the first threshold value or the second threshold value. The post-processing unit 133 may increase the accuracy and recognition rate of speech recognition by allowing the user's confirmation request not to be performed immediately for the selected name.

또한, 검색된 이름 후보에 대한 카테고리의 개수가 미리 정해진 제2기준 개수를 초과하는 경우, 후처리부(133)는 제3임계값을 증가시킬 수 있다. 이 경우, 인식 결과 사이에 대한 신뢰도 점수 차이가 큰 경우에도 사용자에 대한 확인 요청이 수행되고, 사용자로부터 확인된 이름 후보가 선택될 수 있다. 따라서, 음성 인식의 정확성 및 인식률이 증대될 수 있다.In addition, when the number of categories for the searched name candidate exceeds a predetermined second reference number, the post-processing unit 133 may increase the third threshold value. In this case, even if the difference in the reliability score between the recognition results is large, a request for confirmation of the user is performed, and a name candidate confirmed from the user can be selected. Therefore, the accuracy and recognition rate of speech recognition can be increased.

후처리부(133)는 변경된 적어도 하나의 임계값을 신뢰도 점수 DB(144)에 저장함으로서 임계값을 업데이트할 수 있다. 또한, 후처리부(133)는 변경된 임계값에 대한 사용자 패턴을 생성하거나 저장된 사용자 패턴이 포함하는 임계값을 변경된 임계값으로 변경함으로써 사용자 패턴을 업데이트할 수 있다. The post-processing unit 133 may update the threshold value by storing the changed at least one threshold value in the reliability score DB 144. In addition, the post-processing unit 133 may update the user pattern by generating a user pattern for the changed threshold value or by changing the threshold value included in the stored user pattern to the changed threshold value.

한편, 전처리부(131), 음성 인식부(132), 및 후처리부(133)는 각각 별개의 메모리 및 프로세서를 포함할 수도 있고, 메모리와 프로세서를 상호 간에 공유할 수도 있다. Meanwhile, the pre-processing unit 131, the voice recognition unit 132, and the post-processing unit 133 may include separate memories and processors, and may share the memory and the processor with each other.

또한, 메모리 및 프로세서는 복수 개 사용될 수도 있는바, 이 경우, 복수의 메모리와 프로세서가 하나의 칩 상에 집적될 수도 있고, 물리적으로 분리된 위치에 마련될 수도 있다.In addition, a plurality of memory and processors may be used. In this case, a plurality of memories and processors may be integrated on one chip, or may be provided in physically separate locations.

도 3에 도시된 제어부(130)의 구성 요소들의 성능에 대하여 적어도 하나의 구성요소가 추가되거나 삭제될 수 있다. 또한, 구성 요소들의 상호 위치는 시스템의 성능 또는 구조에 대응하여 변경될 수 있다는 것은 당해 기술 분야에서 통상의 지식을 가진 자에게 용이하게 이해될 것이다.At least one component may be added or deleted with respect to the performance of the components of the control unit 130 illustrated in FIG. 3. In addition, it will be readily understood by those skilled in the art that the mutual positions of the components may be changed corresponding to the performance or structure of the system.

도 4는 일 실시예에 따른 인식 결과의 예시를 나타낸 도면이다.4 is a diagram illustrating an example of a recognition result according to an embodiment.

도 4를 참조하면, 일 실시예에 따른 제어부(130)는 사용자가 "James에게 전화 걸어줘"라고 발화하는 경우, 이러한 사용자의 음성에서 James라는 이름을 추출할 수 있다.Referring to FIG. 4, when the user utters "Call James," the controller 130 according to an embodiment may extract the name James from the voice of the user.

제어부(130)는 사용자의 음성 'James'에 대한 적어도 하나의 이름 후보들을 검색할 수 있고, 각 이름 후보들의 신뢰도 점수들을 계산할 수 있다.The controller 130 may search for at least one name candidate for the user's voice 'James', and calculate reliability scores of each name candidate.

제어부(130)는 신뢰도 점수가 미리 설정된 제1임계값(T1)을 초과하는 이름 후보(James, Jason, Jameson, Jade, Jane, Mason, Jeremy) 중에서 사용자의 음성에 대응하는 이름을 선택할 수 있고, 제 1 임계값(T1) 이하의 신뢰도 점수를 갖는 이름 후보(Jade, Johnson, John)는 인식 결과에서 제외할 수 있다. 이 때, 제1임계값(T1)은 신뢰도 점수 X8 및 X7 사이의 값일 수 있다. The control unit 130 may select a name corresponding to the user's voice among name candidates (James, Jason, Jameson, Jade, Jane, Mason, Jeremy) whose reliability score exceeds a preset first threshold value T1, Name candidates (Jade, Johnson, John) having a reliability score below the first threshold T1 may be excluded from the recognition result. At this time, the first threshold value T1 may be a value between the reliability scores X8 and X7.

제어부(130)는 신뢰도 점수가 미리 설정된 제1임계값(T1)을 초과하는 이름 후보의 개수가 복수개이므로, 신뢰도 점수에 따른 우선 순위가 제1순위인 이름 후보(James)와 제2순위인 이름 후보(Jason)의 신뢰도 점수의 차이가 제3임계값(T3)을 초과하는지 여부를 확인할 수 있다.The controller 130 has a plurality of name candidates having a reliability score exceeding a preset first threshold value T1, so that the priority according to the reliability score is the first name candidate and the second priority name It can be confirmed whether the difference in the reliability score of the candidate (Jason) exceeds the third threshold (T3).

제1순위인 이름 후보(James)와 제2순위인 이름 후보(Jason)의 신뢰도 점수의 차이가 제3임계값(T3)을 초과하는 경우, 제어부(130)는 제1순위인 이름 후보(James)의 신뢰도가 제2임계값(T2)를 초과하는지 여부에 따라 사용자의 확인을 요청할지 여부를 결정할 수 있다. When the difference in the reliability score between the first-ranked name candidate James and the second-ranked name candidate Jason exceeds the third threshold T3, the control unit 130 first-ranked name candidate (James) ) May determine whether to request confirmation from the user according to whether the reliability exceeds the second threshold T2.

제1순위인 이름 후보(James)의 신뢰도가 제2임계값(T2)를 초과하는 경우, 신뢰성이 보장되는 경우이므로, 제어부(130)는 1순위인 이름 후보(James)를 사용자 음성에 대응하는 이름으로 선택할 수 있다. When the reliability of the first name candidate (James) exceeds the second threshold value (T2), since reliability is guaranteed, the controller 130 corresponds to the first name candidate (James) corresponding to the user's voice. You can choose by name.

제어부(130)는 선택된 이름(James)에 대한 전화 발신 명령을 통신부(120)로 전송함으로써 'James'에 매칭된 번호로 전화가 발신되도록 할 수 있다.The control unit 130 may transmit a call to the communication unit 120 by sending a phone call command for the selected name (James) so that the call is sent to the number matching 'James'.

또는, 제1순위인 이름 후보(James)의 신뢰도가 제2임계값(T2) 이하인 경우, 신뢰성이 보장되지 않는 경우이므로, 제어부(130)는 1순위인 이름 후보(James)에 대한 확인을 사용자에게 요청할 수 있다.Alternatively, if the reliability of the first name candidate (James) is less than or equal to the second threshold value (T2), since the reliability is not guaranteed, the controller 130 checks for the first-ranked name candidate (James). You can ask.

제1순위인 이름 후보(James)와 제2순위인 이름 후보(Jason)의 신뢰도 점수의 차이가 제3임계값(T3) 이하인 경우, 제어부(130)는 제1순위인 이름 후보(James)에 대한 확인을 사용자에게 시각적 또는 청각적으로 요청할 수 있다. 이를 통해, 제어부(130)는 신뢰성이 보장되지 않는 경우, 적절하게 사용자의 확인을 요청함으로써 음성 인식의 정확도를 높일 수 있다.If the difference in the reliability score between the first name candidate (James) and the second ranking name candidate (Jason) is equal to or less than the third threshold value (T3), the control unit 130 is assigned to the first name candidate (James). You can ask the user for a confirmation visually or audibly. Through this, if the reliability is not guaranteed, the accuracy of speech recognition may be increased by appropriately requesting confirmation from the user.

도 5는 일 실시예에 따른 인식 결과의 예시를 나타낸 도면이다.5 is a diagram illustrating an example of a recognition result according to an embodiment.

도 5를 참조하면, 일 실시예에 따른 제어부(130)는 사용자가 "James에게 전화 걸어줘"라고 발화하는 경우, 이러한 사용자의 음성에서 James라는 이름을 추출할 수 있다. 제어부(130)는 사용자의 음성 ‘James'에 대한 적어도 하나의 이름 후보들을 검색할 수 있고, 각 이름 후보들의 신뢰도 점수들을 계산할 수 있다.Referring to FIG. 5, when the user utters "Call James," the controller 130 according to an embodiment may extract the name James from the voice of the user. The controller 130 may search for at least one name candidate for the user's voice “James” and may calculate reliability scores of each name candidate.

제어부(130)는 단말기(2)의 폰북 정보 중 'James'에 대응하는 적어도 하나의 이름 후보의 개수가 미리 정해진 제1기준 개수 이하이거나 검색된 이름 후보에 대한 카테고리의 개수가 미리 정해진 제2기준 개수 이하인 경우 중 적어도 하나의 경우에 제1임계값(T1) 및 제2임계값(T2)를 증가시키고, 제3임계값(T3)을 감소시킬 수 있다.The control unit 130 has the number of at least one name candidate corresponding to 'James' among the phonebook information of the terminal 2 is equal to or less than a predetermined first reference number, or a second reference number having a predetermined number of categories for the searched name candidates In the following cases, the first threshold value T1 and the second threshold value T2 may be increased and the third threshold value T3 may be decreased.

제어부(130)는 제1임계값(T1)를 증가시킴으로써 제외되는 이름 후보의 수를 2개(Johnson, John)에서 5개(Mason, Jeremy, Jade, Johnson, John)로 증가시킬 수 있다. 즉, 제어부(130)는 고려 범위 내에 포함되는 이름 후보의 수를 감소시킬 수 있다. The controller 130 may increase the number of excluded name candidates from 2 (Johnson, John) to 5 (Mason, Jeremy, Jade, Johnson, John) by increasing the first threshold T1. That is, the control unit 130 may reduce the number of name candidates included in the consideration range.

또한, 제어부(130)는 제2임계값(T2)를 증가시킴으로써 선택된 이름에 대한 제어가 바로 수행될 수 있도록 할 수 있다. 즉, 제어부(130)는 사용자가 인식률이 높은 환경에 있는 경우, 사용자의 확인 없이 선택된 이름에 대한 제어가 수행되도록 할 수 있다.In addition, the control unit 130 may increase the second threshold value T2 so that control of the selected name can be performed immediately. That is, when the user is in an environment where the recognition rate is high, the controller 130 may control the selected name without user confirmation.

또한, 제어부(130)는 제3임계값(T3)를 감소시킴으로써 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수 차이가 작은 경우에도 선택된 이름에 대한 제어가 바로 수행될 수 있도록 할 수 있다. 이 경우, 인식 결과 사이에 대한 신뢰도 점수 차이가 작은 경우에도 사용자에 대한 확인 요청 없이 제1순위인 이름 후보를 선택할 수 있으므로, 사용자의 사용성이 증대될 수 있다.In addition, the control unit 130 reduces the third threshold value T3 so that even if the difference in the reliability score between the first-ranked name candidate and the second-ranked name candidate is small, control of the selected name can be performed immediately. can do. In this case, even if the difference in the reliability score between the recognition results is small, since the first candidate name can be selected without requesting confirmation to the user, the user's usability can be increased.

이를 통해, 제어부(130)는 사용자가 상대적으로 인식률이 높은 환경에 있는 경우를 감지할 수 있고, 음성 인식의 처리 속도를 증대시킬 수 있다. 따라서, 보다 정확하고 빠른 음성 인식을 구현할 수 있다. Through this, the controller 130 can detect a case in which the user is in an environment with a relatively high recognition rate, and may increase the processing speed of speech recognition. Therefore, more accurate and faster speech recognition can be implemented.

도 6은 일 실시예에 따른 사용자 패턴의 예시를 나타낸 도면이다.6 is a diagram illustrating an example of a user pattern according to an embodiment.

도 6을 참조하면, 일 실시예에 따른 제어부(130)는 사용자가 음성을 입력하는 경우 입력된 음성에 대응하여 선택된 이름을 포함하는 사용자 패턴을 생성할 수 있다. Referring to FIG. 6, when a user inputs a voice, the controller 130 according to an embodiment may generate a user pattern including a selected name corresponding to the input voice.

제어부(130)는 사용자가 음성 인식 기능을 이용하면서 제어 기초로 활용된 정보들을 사용자 패턴에 포함시켜 저장할 수 있다. 즉, 제어부(130)는 입력된 사용자 음성에 대응하는 이름을 선택하는데 활용된 정보들을 사용자 패턴에 포함시킬 수 있다. The controller 130 may include and store information utilized as a control basis in the user pattern while the user uses the voice recognition function. That is, the controller 130 may include information used to select a name corresponding to the input user voice in the user pattern.

예를 들어, 제어부(130)는 선택된 이름(홍길동)에 대한 카테고리 정보(모바일), 신뢰도 점수(5100), 제1임계값(3000), 제2임계값(5000), 제3임계값(500)을 사용자 패턴으로 저장할 수 있으며, 추천 액션(Direct call) 및 수행 여부(예)를 포함하는 사용자 패턴을 생성하고, 이를 저장할 수 있다. For example, the controller 130 may include category information (mobile), a reliability score (5100), a first threshold value (3000), a second threshold value (5000), and a third threshold value (500) for the selected name (Hong Gil-dong). ) May be stored as a user pattern, and a user pattern including a recommended action (direct call) and whether or not to be performed (eg) may be generated and stored.

이 경우, 추천 액션은 제어부(130)가 생성한 제어 명령의 종류를 나타낼 수 있고, 사용자의 확인 요청 없이 선택된 이름에 대하여 전화 발신 명령이 생성되는 경우(Direct Call), 사용자의 확인을 요청한 후 확인된 이름에 대하여 전화 발신 명령이 생성되는 경우(Confirmation Call) 및 복수개의 후보 중 사용자의 선택을 요청한 후 선택된 이름에 대하여 전화 발신 명령이 생성되는 경우(N-best Call)를 포함할 수 있다. In this case, the recommended action may indicate the type of the control command generated by the control unit 130, and when a call originating command is generated for the selected name without a user's request for confirmation (Direct Call), confirms after requesting confirmation from the user It may include a case in which a phone call command is generated for a given name (Confirmation Call) and a case in which a phone call command is generated for a selected name after requesting a user's selection among a plurality of candidates (N-best Call).

또한, 제어부(130)는 사용자가 음성 인식 기능을 이용할 때마다 선택된 이름(홍길동)에 대한 사용자 패턴을 생성하여 이를 데이터베이스화할 수 있고, 이를 추후 임계값 결정에 활용할 수 있다. 따라서, 사용자 개개인의 환경에 적합한 음성 인식 기능을 제공할 수 있다. In addition, the control unit 130 may generate a user pattern for the selected name (Hong Gil-dong) every time the user uses the voice recognition function and make it a database, which can be used for later threshold determination. Therefore, it is possible to provide a speech recognition function suitable for an individual user's environment.

도 7은 일 실시예에 다른 디스플레이에 표시될 수 있는 화면의 예시를 나타낸 도면이다.7 is a view showing an example of a screen that can be displayed on another display in one embodiment.

도 7을 참조하면, 일 실시예에 따른 제어부(130)는 사용자로부터 음성("Call James")이 입력되면, 입력된 음성 중 이름(James)에 대응하는 적어도 하나의 이름 후보(152a)를 사용자에게 표시함으로써 사용자에게 이름의 선택을 요청할 수 있다. Referring to FIG. 7, when a voice (“Call James”) is input from a user, the control unit 130 according to an embodiment may use at least one name candidate 152a corresponding to the name of the input voice (James). You can ask the user to choose a name by displaying.

사용자는 표시된 이름 후보(152a) 중 하나를 선택할 수 있고, 사용자로부터 사용자의 음성에 대응하는 이름을 수신하면, 제어부(130)는 선택된 이름에 대한 제어 명령을 통신부(120)로 전송할 수 있다. 구체적으로, 제어부(130)는 선택된 이름에 대한 전화 발신 명령을 통신부(120)로 전송할 수 있다. The user may select one of the displayed name candidates 152a, and upon receiving a name corresponding to the user's voice from the user, the controller 130 may transmit a control command for the selected name to the communication unit 120. Specifically, the control unit 130 may transmit a call origination command for the selected name to the communication unit 120.

또한, 제어부(130)는 이름에 대한 선택 뿐만 아니라 사용자의 음성에 대응하는 이름에 대한 카테고리의 선택을 요청할 수 있다. In addition, the controller 130 may request selection of a category for a name corresponding to a user's voice as well as selection for a name.

구체적으로, 제어부(130)는 사용자의 음성에 대응하는 이름에 대한 카테고리의 확률값이 미리 정해진 신뢰도 점수 이하이면, 사용자에게 카테고리에 대한 선택을 요청할 수 있다. 이 경우, 제어부(130)는 미리 정해진 개수의 카테고리 후보를 사용자에게 표시함으로써 사용자에게 카테고리에 대한 선택을 요청할 수 있다. Specifically, if the probability value of a category for a name corresponding to a user's voice is equal to or less than a predetermined reliability score, the controller 130 may request the user to select a category. In this case, the controller 130 may request the user to select a category by displaying a predetermined number of category candidates to the user.

이후, 사용자로부터 카테고리의 선택이 수신되면, 제어부(130)는 선택된 카테고리에 대한 제어를 수행할 수 있다. 즉, 제어부(130)는 선택된 카테고리에 매칭되는 전화 번호에 대한 통화 발신 명령을 전송할 수 있다.Thereafter, when a selection of a category is received from the user, the control unit 130 may perform control for the selected category. That is, the controller 130 may transmit a call originating command for a phone number matching the selected category.

도 8은 일 실시예에 다른 디스플레이에 표시될 수 있는 화면의 예시를 나타낸 도면이다.8 is a view showing an example of a screen that can be displayed on another display in one embodiment.

도 8을 참조하면, 일 실시예에 따른 제어부(130)는 사용자로부터 음성("Call James")에 대응하는 이름 후보(James)에 대한 확인을 시각적으로 요청할 수 있다. 제어부(130)는 선택된 이름 후보(James)에 대한 정보를 표시함으로써 사용자에게 선택된 이름 후보에 대한 확인을 요청할 수 있다. 이 때, 선택된 이름 후보(James)에 대한 정보로써 표시되는 정보는 이름(James), 카테고리(Mobile), 전화 번호(01234567890)를 포함할 수 있다. Referring to FIG. 8, the controller 130 according to an embodiment may visually request confirmation of a name candidate corresponding to a voice (“Call James”) from a user. The controller 130 may request the user to confirm the selected name candidate by displaying information on the selected name candidate (James). At this time, information displayed as information on the selected name candidate (James) may include a name (James), a category (Mobile), and a phone number (01234567890).

표시된 이름이 음성 입력한 이름에 대응되는 경우, 사용자는 디스플레이(152)에 표시된 확인 여부 인터페이스(152b, 152c)를 통하여 이름 후보에 대한 확인을 입력할 수 있다. When the displayed name corresponds to the voice input name, the user may input a confirmation of the name candidate through the confirmation whether interfaces 152b and 152c displayed on the display 152.

사용자로부터 해당 이름 후보에 대한 확인이 이루어지는 경우, 확인된 이름 후보를 사용자 음성에 대응하는 이름으로 선택할 수 있고, 선택된 이름에 대한 제어를 수행할 수 있다. 즉, 제어부(130)는 선택된 이름에 매칭되는 전화 번호에 대한 통화 발신 명령을 전송할 수 있다.When the name candidate is confirmed by the user, the identified name candidate may be selected as a name corresponding to the user's voice, and control of the selected name may be performed. That is, the controller 130 may transmit a call origination command for a phone number matching the selected name.

도 9 는 일 실시예에 따른 차량의 제어방법을 나타낸 흐름도이다.9 is a flowchart illustrating a method for controlling a vehicle according to an embodiment.

도 9를 참조하면, 일 실시예에 따른 차량(1)은 사용자로부터 음성이 입력되는지 여부를 확인할 수 있다(701).Referring to FIG. 9, the vehicle 1 according to an embodiment may check whether a voice is input from a user (701).

사용자로부터 음성이 입력되면(701의 예), 차량(1)은 음성 인식 및 입력된 음성에 대응되는 이름을 검색할 수 있다(702). 구체적으로, 차량(1)은 입력된 음성에 대응되는 적어도 하나의 이름 후보를 검색할 수 있다. When a voice is input from the user (YES in 701), the vehicle 1 may recognize the voice and search for a name corresponding to the input voice (702). Specifically, the vehicle 1 may search for at least one name candidate corresponding to the input voice.

차량(1)은 적어도 하나의 이름 후보에 대한 신뢰도 점수를 계산할 수 있다(703). 예를 들어, N-best 탐색법을 이용하는 경우, 차량(1)은 N개까지의 이름 후보를 검색할 수 있다. 차량(1)은 N개의 이름 후보의 순위를 평가함으로써 인식 결과를 출력할 수 있고, N개의 이름 후보에 대하여 신뢰도 점수를 산출할 수 있다. The vehicle 1 may calculate a reliability score for at least one name candidate (703). For example, when using the N-best search method, the vehicle 1 can search up to N name candidates. The vehicle 1 can output the recognition result by evaluating the rank of N name candidates, and can calculate a reliability score for the N name candidates.

이후, 차량(1)은 이름 후보 각각에 대하여 신뢰도 점수가 미리 설정된 제1임계값(threshold)를 초과하는지 여부를 확인할 수 있고, 검색된 이름 후보 중 신뢰도 점수가 제1임계값을 초과하는 이름 후보가 존재하는지 여부를 확인할 수 있다(704). 이 때, 제1임계값은 인식 결과에 대한 최소한의 신뢰성을 보장하는 신뢰도 점수를 의미할 수 있다. Thereafter, the vehicle 1 may check whether the reliability score for each name candidate exceeds a preset first threshold, and among the searched name candidates, a name candidate whose reliability score exceeds the first threshold It can be checked whether it exists (704). In this case, the first threshold value may mean a reliability score that guarantees minimum reliability for the recognition result.

검색된 이름 후보 중 신뢰도 점수가 제1임계값을 초과하는 이름 후보가 존재하는 경우(704의 예), 차량(1)은 검색된 이름 후보 중 신뢰도 점수가 미리 설정된 제1임계값(threshold)을 초과하는 이름 후보를 추출할 수 있고, 추출된 이름 후보의 개수가 하나인지 여부를 확인할 수 있다(705).If there is a name candidate whose reliability score exceeds the first threshold among the searched name candidates (YES in 704), the vehicle 1 has a reliability score among the searched name candidates that exceeds a preset first threshold. A name candidate can be extracted, and it can be checked whether the number of extracted name candidates is one (705).

또한, 차량(1)은 인식 결과에 포함된 적어도 하나의 이름 후보 중 신뢰도가 미리 설정된 제1임계값을 초과하는 이름 후보가 1개인 경우(705의 예), 검색된 이름 후보를 사용자 음성에 대응하는 이름으로 선택할 수 있고(706), 선택된 이름 후보의 신뢰도 점수가 제2임계값을 초과하는지 여부를 판단할 수 있다(707).In addition, when there is one name candidate whose reliability exceeds a preset first threshold among at least one name candidate included in the recognition result (example of 705), the vehicle 1 corresponds to the searched name candidate corresponding to the user's voice. It can be selected by name (706), and it can be determined whether the reliability score of the selected name candidate exceeds the second threshold (707).

이 때, 제2임계값은 인식 결과에 대한 최대한의 신뢰성을 보장할 수 있는 신뢰도 점수를 의미할 수 있고, 제1임계값보다 클 수 있다.At this time, the second threshold value may mean a reliability score capable of ensuring maximum reliability of the recognition result, and may be greater than the first threshold value.

선택된 이름 후보의 신뢰도 점수가 제2임계값을 초과하는 경우(707의 예), 차량(1)은 선택된 이름에 대한 제어를 수행할 수 있다(708). 구체적으로, 차량(1)은 선택된 이름에 대한 전화 발신 제어 명령을 단말기(2)로 전송함으로써 선택된 이름에 대한 전화 발신 동작을 수행할 수 있다. When the reliability score of the selected name candidate exceeds the second threshold (YES in 707), the vehicle 1 may perform control of the selected name (708). Specifically, the vehicle 1 may perform a call operation for the selected name by transmitting a call control command for the selected name to the terminal 2.

이후, 차량(1)은 선택된 이름에 대한 제어 명령에 따른 동작이 취소되는지 여부를 확인할 수 있고(709), 사용자 의하여 동작이 취소되는 경우(709의 예), 신뢰도 점수 DB를 업데이트할 수 있다(710). Thereafter, the vehicle 1 may check whether the operation according to the control command for the selected name is canceled (709), and when the operation is canceled by the user (YES in 709), the reliability score DB may be updated ( 710).

구체적으로, 차량(1)은 신뢰도 점수 DB에 저장된 인식 결과에 대한 신뢰도 점수를 변경할 수 있다. 예를 들어, 차량(1)은 사용자에 의하여 동작이 취소되는 경우는, 인식 결과에 오류가 있는 것으로 판단하여, 해당 인식 결과에 대한 신뢰도 점수를 감소시킬 수 있다. 이를 통해, 차량(1)은 음성 인식에 대한 정확도를 향상시킬 수 있다. Specifically, the vehicle 1 may change the reliability score for the recognition result stored in the reliability score DB. For example, when the operation is canceled by the user, the vehicle 1 may determine that there is an error in the recognition result, and reduce the reliability score for the recognition result. Through this, the vehicle 1 can improve accuracy for speech recognition.

다른 예로, 선택된 이름 후보의 신뢰도 점수가 제2임계값 이하인 경우(707의 아니오), 신뢰성이 보장되지 않는 경우이므로, 차량(1)은 선택된 이름에 대한 사용자의 확인을 요청할 수 있다(714). As another example, when the reliability score of the selected name candidate is less than or equal to the second threshold (No in 707), since reliability is not guaranteed, the vehicle 1 may request confirmation of the user for the selected name (714).

사용자로부터 해당 이름 후보에 대한 확인이 이루어지는 경우, 차량(1)은 확인된 이름 후보를 사용자 음성에 대응하는 이름으로 선택할 수 있다. 이후, 차량(1)은 708 내지 710의 동작을 수행하며, 전술한 바와 동일하다.When confirmation of the corresponding name candidate is made by the user, the vehicle 1 may select the identified name candidate as a name corresponding to the user's voice. Thereafter, the vehicle 1 performs operations 708 to 710, and is the same as described above.

다른 예로, 검색된 이름 후보 중 신뢰도 점수가 제1임계값을 초과하는 이름 후보가 존재하지 않는 경우(704의 아니오), 인식 결과에 대한 신뢰성을 보장할 수 없으므로 차량(1)은 인식 결과를 거절(rejection)할 수 있다(711). 즉, 인식 실패를 확인할 수 있다. 이 경우, 차량(1)은 사용자에게 음성을 다시 입력할 것을 디스플레이(152) 또는 스피커(151)를 통하여 요청할 수 있다.As another example, if there is no name candidate whose reliability score exceeds the first threshold among the searched name candidates (No in 704), the reliability of the recognition result cannot be guaranteed, so the vehicle 1 rejects the recognition result ( rejection). That is, the recognition failure can be confirmed. In this case, the vehicle 1 may request the user to input the voice again through the display 152 or the speaker 151.

다른 예로, 인식 결과에 포함된 적어도 하나의 이름 후보 중 신뢰도가 미리 설정된 제1임계값을 초과하는 이름 후보가 복수개인 경우(705의 아니오),As another example, if there is a plurality of name candidates whose reliability exceeds a preset first threshold among at least one name candidate included in the recognition result (No in 705),

차량(1)은 복수개의 이름 후보의 우선 순위를 신뢰도 점수에 기초하여 결정할 수 있고, 복수개의 이름 후보 중 제1순위와 제2순위 사이의 신뢰도 점수의 차이가 제3임계값을 초과하는지 여부를 확인할 수 있다(712).The vehicle 1 may determine the priority of the plurality of name candidates based on the reliability score, and whether or not the difference in the reliability scores between the first and second ranks among the plurality of name candidates exceeds the third threshold value. It can be confirmed (712).

이 때, 제3임계값은 인식 결과 간의 신뢰도 점수의 차이에 대한 신뢰성을 보장하는 임계값을 의미할 수 있고, 제 1 임계값 및 제2임계값 보다 작은 신뢰도 점수를 갖는 임계값일 수 있다.In this case, the third threshold value may mean a threshold value that guarantees reliability of the difference in the reliability score between the recognition results, and may be a threshold value having a reliability score smaller than the first threshold value and the second threshold value.

복수개의 이름 후보 중 제1순위와 제2순위 사이의 신뢰도 점수의 차이가 제3임계값을 초과하는 경우(712의 예), 제1순위인 이름 후보에 대한 신뢰성이 보장되므로, 차량(1)은 우선 순위가 제1순위인 이름 후보를 사용자의 음성에 대응하는 이름으로 선택할 수 있다(713). 이후, 차량(1)은 708 내지 710의 동작을 수행하며, 전술한 바와 동일하다. If the difference in the reliability score between the first and second ranks among the plurality of name candidates exceeds the third threshold value (YES in 712), the reliability of the first name candidate, which is the first rank, is guaranteed, so the vehicle 1 May select a name candidate having a first priority as a name corresponding to the user's voice (713). Thereafter, the vehicle 1 performs operations 708 to 710, and is the same as described above.

다른 예로, 복수개의 이름 후보 중 제1순위와 제2순위 사이의 신뢰도 점수의 차이가 제3임계값 이하인 경우(712의 아니오)의 차량(1)의 동작은 도 10을 참조하여 설명한다.As another example, the operation of the vehicle 1 when the difference in the reliability score between the first rank and the second rank among the plurality of name candidates is less than or equal to the third threshold (No in 712) will be described with reference to FIG. 10.

도 10은 일 실시예에 따른 차량의 제어방법을 나타낸 흐름도이다.10 is a flowchart illustrating a method for controlling a vehicle according to an embodiment.

도 10을 참조하면, 복수개의 이름 후보 중 제1순위와 제2순위 사이의 신뢰도 점수의 차이가 제3임계값 이하인 경우(도 9, 712의 아니오), 일 실시예에 따른 차량(1)은 이름 후보 중 제1순위에 포함된 카테고리가 복수개인지 여부를 확인할 수 있다(801).Referring to FIG. 10, when a difference in a reliability score between a first rank and a second rank among a plurality of name candidates is equal to or less than a third threshold (No in FIGS. 9 and 712), the vehicle 1 according to an embodiment It may be checked whether there are a plurality of categories included in the first rank among the name candidates (801).

이 때, 카테고리는 전화 번호에 대한 종류를 의미하며, 모바일’, '집' 및 '오피스' 중 적어도 하나일 수 있다.At this time, the category refers to the type of the phone number, and may be at least one of 'mobile', 'home', and 'office'.

이름 후보 중 제1순위에 포함된 카테고리가 복수개인 경우(801의 예), 차량(1)은 사용자 패턴에 기초하여 카테고리를 선택할 수 있다(802).If there are multiple categories included in the first rank among the name candidates (YES in 801), the vehicle 1 may select a category based on the user pattern (802).

구체적으로, 차량(1)은 사용자 패턴의 이름별 카테고리에 대한 발신 시간 또는 이름별 카테고리에 대한 수신 시간 중 적어도 하나에 기초하여 복수개의 카테고리 각각의 확률값을 결정할 수 있다. 차량(1)은 복수개의 카테고리별 확률값에 기초하여 최대 확률값을 갖는 카테고리를 선택할 수 있다. Specifically, the vehicle 1 may determine a probability value of each of a plurality of categories based on at least one of a transmission time for a category by name of a user pattern or a reception time for a category by name. The vehicle 1 may select a category having a maximum probability value based on a plurality of category-specific probability values.

그 다음, 차량(1)은 선택된 카테고리의 확률값이 제4임계값을 초과하는지 여부를 확인할 수 있다(803). 이 때, 제4임계값은 미리 정해진 신뢰도 점수를 의미할 수 있으며, 신뢰도 점수 DB(144)에 저장될 수 있다. Then, the vehicle 1 may check whether the probability value of the selected category exceeds the fourth threshold value (803). At this time, the fourth threshold value may mean a predetermined reliability score, and may be stored in the reliability score DB 144.

선택된 카테고리의 확률값이 제4임계값을 초과하는 경우(803의 예), 차량(1)은 선택된 카테고리에 대한 제어를 수행할 수 있다(804). 즉, 차량(1)은 제1순위 이름 후보에 대한 선택된 카테고리에 매칭되는 전화 번호에 대한 통화 발신 명령을 전송할 수 있다.When the probability value of the selected category exceeds the fourth threshold value (YES in 803), the vehicle 1 may perform control for the selected category (804). That is, the vehicle 1 may transmit a call originating command for a phone number matching the selected category for the first rank name candidate.

이 경우, 차량(1)은 사용자 개인의 통화 특성을 반영한 사용자 패턴을 이용하므로, 보다 정확한 통화 발신 명령을 전송할 수 있다. 따라서, 음성 인식을 이용한 통화 기능을 제공함에 있어서, 보다 정확한 통화 기능 제공이 가능할 수 있으므로, 사용성 및 편의성이 증대될 수 있다.In this case, since the vehicle 1 uses a user pattern reflecting the call characteristics of the user, a more accurate call originating command can be transmitted. Therefore, in providing a call function using voice recognition, since a more accurate call function may be provided, usability and convenience may be increased.

다른 예로, 선택된 카테고리의 확률값이 제4임계값 이하인 경우(803의 아니오), 차량(1)은 사용자에게 카테고리에 대한 선택을 요청할 수 있다(806). 이 경우, 차량(1)은 선택된 카테고리에 대한 제어를 바로 수행하지 않고, 미리 정해진 개수의 카테고리 후보를 사용자에게 표시함으로써 사용자에게 카테고리에 대한 선택을 요청할 수 있다.As another example, when the probability value of the selected category is less than or equal to the fourth threshold (No in 803), the vehicle 1 may request the user to select a category (806). In this case, the vehicle 1 may request the user to select a category by displaying a predetermined number of category candidates to the user without directly controlling the selected category.

차량(1)은 사용자로부터 카테고리의 선택이 수신되는지 여부를 확인할 수 있고(807), 사용자로부터 카테고리의 선택이 수신되면(807의 예), 차량(1)은 선택된 카테고리에 대한 제어를 수행할 수 있다. 즉, 차량(1)은 제1순위 이름 후보에 대한 선택된 카테고리에 매칭되는 전화 번호에 대한 통화 발신 명령을 전송할 수 있다.The vehicle 1 may check whether a selection of a category is received from the user (807), and when a selection of a category is received from the user (YES in 807), the vehicle 1 may perform control for the selected category. have. That is, the vehicle 1 may transmit a call originating command for a phone number matching the selected category for the first rank name candidate.

이를 통해, 보다 정확한 사용자 음성 인식 기능이 제공될 수 있고, 사용자의 음성 인식 성공률이 높아지므로 사용자의 편의성이 증대될수 있다.Through this, a more accurate user voice recognition function may be provided, and a user's convenience may be increased because a user's voice recognition success rate is increased.

다른 예로, 이름 후보 중 제1순위에 포함된 카테고리가 복수개가 아닌 경우(801의 아니오), 차량(1)은 사용자에게 카테고리에 대한 선택을 요청할 수 있다(805). 이 경우, 차량(1)은 선택된 카테고리에 대한 제어를 바로 수행하지 않고, 미리 정해진 개수의 카테고리 후보를 사용자에게 표시함으로써 사용자에게 카테고리에 대한 선택을 요청할 수 있다.As another example, if there are not a plurality of categories included in the first rank among the name candidates (No in 801), the vehicle 1 may request the user to select a category (805). In this case, the vehicle 1 may request the user to select a category by displaying a predetermined number of category candidates to the user without directly controlling the selected category.

이후, 사용자로부터 카테고리의 선택이 수신되면, 차량(1)은 선택된 카테고리에 대한 제어를 수행할 수 있다. 즉, 차량(1)은 제1순위 이름 후보에 대한 선택된 카테고리에 매칭되는 전화 번호에 대한 통화 발신 명령을 전송할 수 있다.Then, when a selection of a category is received from the user, the vehicle 1 may perform control for the selected category. That is, the vehicle 1 may transmit a call originating command for a phone number matching the selected category for the first rank name candidate.

이를 통해, 보다 정확한 사용자 음성 인식 기능이 제공될 수 있고, 사용자의 음성 인식 성공률이 높아지므로 사용자의 편의성이 증대될 수 있다.Through this, a more accurate user voice recognition function may be provided, and a user's convenience may be increased because a user's voice recognition success rate is increased.

한편, 개시된 실시예들은 컴퓨터에 의해 실행 가능한 명령어를 저장하는 기록매체의 형태로 구현될 수 있다. 명령어는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 프로그램 모듈을 생성하여 개시된 실시예들의 동작을 수행할 수 있다. 기록매체는 컴퓨터로 읽을 수 있는 기록매체로 구현될 수 있다.Meanwhile, the disclosed embodiments may be implemented in the form of a recording medium that stores instructions executable by a computer. Instructions may be stored in the form of program code, and when executed by a processor, may generate program modules to perform operations of the disclosed embodiments. The recording medium may be embodied as a computer-readable recording medium.

컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터에 의하여 해독될 수 있는 명령어가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다. The computer-readable recording medium includes all kinds of recording media storing instructions that can be read by a computer. For example, there may be a read only memory (ROM), a random access memory (RAM), a magnetic tape, a magnetic disk, a flash memory, and an optical data storage device.

이상에서와 같이 첨부된 도면을 참조하여 개시된 실시예들을 설명하였다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고도, 개시된 실시예들과 다른 형태로 본 발명이 실시될 수 있음을 이해할 것이다. 개시된 실시예들은 예시적인 것이며, 한정적으로 해석되어서는 안 된다.As described above, the disclosed embodiments have been described with reference to the accompanying drawings. Those of ordinary skill in the art to which the present invention pertains will understand that the present invention may be practiced in different forms from the disclosed embodiments without changing the technical spirit or essential features of the present invention. The disclosed embodiments are illustrative and should not be construed as limiting.

110: 음성 입력부
120: 통신부
130: 제어부
140: 저장부
151: 스피커
152: 디스플레이
160: 입력부
110: voice input unit
120: communication unit
130: control unit
140: storage
151: speaker
152: display
160: input unit

Claims (26)

통화 기능을 제공하는 단말기과 통신하는 통신부;
사용자의 음성을 입력 받는 음성 입력부;
상기 사용자의 통화 패턴에 관한 사용자 패턴을 저장하는 저장부; 및
상기 사용자의 음성이 입력되면 상기 입력된 음성에 대응하는 적어도 하나의 이름 후보를 검색하고, 상기 적어도 하나의 이름 후보의 신뢰도 점수(confidence score)에 대한 임계값(threshold)을 상기 사용자 패턴에 기초하여 결정하고, 상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 제어부;를 포함하는 차량.
A communication unit communicating with a terminal providing a call function;
A voice input unit that receives a user's voice;
A storage unit that stores a user pattern related to the user's call pattern; And
When the voice of the user is input, at least one name candidate corresponding to the input voice is searched, and a threshold for a confidence score of the at least one name candidate is based on the user pattern. And a controller which determines and selects a name corresponding to the input voice among the at least one name candidate based on the determined threshold.
제1항에 있어서,
상기 제어부는,
상기 단말기의 폰북 정보 및 통화 내역 정보가 수신되면, 상기 수신된 폰북 정보 및 통화 내역 정보에 기초하여 사용자 패턴을 생성하는 차량.
According to claim 1,
The control unit,
A vehicle that generates a user pattern based on the received phonebook information and call history information when the phonebook information and call history information of the terminal are received.
제1항에 있어서,
상기 제어부는,
상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보 중 상기 입력된 음성에 대응하는 이름을 선택하는 차량.
According to claim 1,
The control unit,
A vehicle that selects a name corresponding to the input voice among name candidates whose reliability score exceeds a first threshold.
제3항에 있어서,
상기 제어부는,
상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보의 개수가 1개인 경우, 해당 이름 후보의 신뢰도 점수가 제 2 임계값을 초과하는지 여부를 판단하고, 해당 이름 후보의 신뢰도 점수가 제 2 임계값을 초과하면, 해당 이름 후보를 상기 입력된 음성에 대응하는 이름으로 선택하는 차량.
According to claim 3,
The control unit,
When the number of name candidates whose reliability score exceeds the first threshold is 1, it is determined whether the reliability score of the name candidate exceeds the second threshold, and the reliability score of the name candidate is the second threshold If it exceeds, the vehicle selecting the name candidate as a name corresponding to the input voice.
제4항에 있어서,
상기 제어부는,
상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보의 신뢰도 점수가 상기 제2임계값 이하이면, 해당 이름 후보에 대한 확인을 상기 사용자에게 요청하는 차량.
The method of claim 4,
The control unit,
If the reliability score of the name candidate whose reliability score exceeds the first threshold is less than or equal to the second threshold, the vehicle requesting confirmation from the name candidate to the user.
제3항에 있어서,
상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보의 개수가 복수개인 경우, 상기 복수개의 이름 후보의 우선 순위를 상기 신뢰도 점수에 기초하여 결정하고, 상기 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이와 제3임계값을 비교하고, 상기 비교 결과에 기초하여 상기 입력된 음성에 대응하는 이름을 선택하는 차량.
According to claim 3,
If the number of name candidates whose reliability score exceeds the first threshold is plural, the priority of the plurality of name candidates is determined based on the reliability score, and the name candidate and the priority whose priority is the first priority A vehicle that compares a difference in reliability score between a second-ranked name candidate and a third threshold value and selects a name corresponding to the input voice based on the comparison result.
제6항에 있어서,
상기 제어부는,
상기 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이가 상기 제3임계값을 초과하면, 상기 우선 순위가 제1순위인 이름 후보를 상기 입력된 음성에 대응하는 이름으로 선택하는 차량.
The method of claim 6,
The control unit,
When the difference in the reliability score between the first-ranked name candidate and the second-ranked name candidate exceeds the third threshold value, the first-ranked name candidate corresponds to the input voice. Vehicle to choose by name to say.
제6항에 있어서,
상기 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이가 상기 제3임계값 이하이면, 상기 우선 순위가 제1순위인 이름 후보에 대한 확인을 상기 사용자에게 요청하는 차량.
The method of claim 6,
If the difference in the reliability score between the first-ranked name candidate and the second-ranked name candidate is less than or equal to the third threshold, the user is requested to confirm the first-ranked name candidate. Vehicle.
제1항에 있어서,
상기 제어부는,
상기 단말기의 폰북 정보가 수신되면, 상기 수신된 폰북 정보 중 상기 입력된 음성에 대응하는 적어도 하나의 이름 후보를 검색하고, 상기 검색된 이름 후보의 개수에 기초하여 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경하는 차량.
According to claim 1,
The control unit,
When the phonebook information of the terminal is received, at least one name candidate corresponding to the input voice is searched among the received phonebook information, and a first threshold value, a second threshold value, or Vehicles that change at least one of the third thresholds.
제9항에 있어서,
상기 제어부는,
상기 검색된 이름 후보의 개수가 미리 정해진 제1기준 개수 이하인 경우, 상기 제2임계값을 증가시키고, 상기 제3임계값을 감소시키는 차량.
The method of claim 9,
The control unit,
A vehicle that increases the second threshold value and decreases the third threshold value when the number of searched name candidates is equal to or less than a predetermined first reference number.
제9항에 있어서,
상기 제어부는,
상기 폰북 정보로부터 상기 검색된 이름 후보에 대한 카테고리의 개수를 확인하고, 상기 카테고리의 개수에 기초하여 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경하는 차량.
The method of claim 9,
The control unit,
A vehicle that checks the number of categories for the searched name candidate from the phonebook information and changes at least one of a first threshold value, a second threshold value, or a third threshold value based on the number of categories.
제11항에 있어서,
상기 제어부는,
상기 카테고리의 개수가 미리 정해진 제2기준 개수 이하인 경우, 상기 제2임계값을 증가시키고, 상기 제3임계값을 감소시키는 차량.
The method of claim 11,
The control unit,
A vehicle that increases the second threshold value and decreases the third threshold value when the number of categories is equal to or less than a predetermined second reference number.
제1항에 있어서,
상기 제어부는,
상기 선택된 이름에 대한 제어 명령을 상기 단말기로 전송하도록 상기 통신부를 제어하는 차량.
According to claim 1,
The control unit,
A vehicle that controls the communication unit to transmit a control command for the selected name to the terminal.
사용자의 음성을 입력 받고;
상기 사용자의 음성이 입력되면 상기 입력된 음성에 대응하는 적어도 하나의 이름 후보를 검색하고;
상기 적어도 하나의 이름 후보의 신뢰도 점수(confidence score)에 대한 임계값(threshold)을 사용자 패턴에 기초하여 결정하고;
상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 것;을 포함하는 차량의 제어방법.
Receiving the user's voice;
When the user's voice is input, search for at least one name candidate corresponding to the input voice;
Determining a threshold for a confidence score of the at least one name candidate based on a user pattern;
And selecting a name corresponding to the input voice among the at least one name candidate based on the determined threshold.
제14항에 있어서,
단말기의 폰북 정보 및 통화 내역 정보가 수신되면, 상기 수신된 폰북 정보 및 통화 내역 정보에 기초하여 사용자 패턴을 생성하는 것;을 더 포함하는 차량의 제어방법.
The method of claim 14,
And generating a user pattern based on the received phonebook information and call history information when the phonebook information and call history information of the terminal are received.
제14항에 있어서,
상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 것은,
상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보 중 상기 입력된 음성에 대응하는 이름을 선택하는 것;을 포함하는 차량의 제어방법.
The method of claim 14,
Selecting a name corresponding to the input voice among the at least one name candidate based on the determined threshold,
And selecting a name corresponding to the input voice among name candidates in which the reliability score exceeds a first threshold value.
제16항에 있어서,
상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 것은,
상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보의 개수가 1개인 경우, 해당 이름 후보의 신뢰도 점수가 제 2 임계값을 초과하는지 여부를 판단하고, 해당 이름 후보의 신뢰도 점수가 제 2 임계값을 초과하면, 해당 이름 후보를 상기 입력된 음성에 대응하는 이름으로 선택하는 것;을 포함하는 차량의 제어방법.
The method of claim 16,
Selecting a name corresponding to the input voice among the at least one name candidate based on the determined threshold,
When the number of name candidates whose reliability score exceeds the first threshold is 1, it is determined whether the reliability score of the name candidate exceeds the second threshold, and the reliability score of the name candidate is the second threshold If it exceeds, selecting the name candidate as a name corresponding to the input voice; Vehicle control method comprising a.
제17항에 있어서,
상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보의 신뢰도 점수가 상기 제2임계값 이하이면, 해당 이름 후보에 대한 확인을 상기 사용자에게 요청하는 것;을 더 포함하는 차량의 제어방법.
The method of claim 17,
And if the reliability score of the name candidate whose reliability score exceeds the first threshold is less than or equal to the second threshold, requesting the user to confirm the name candidate.
제16항에 있어서,
상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 것은,
상기 신뢰도 점수가 제1임계값을 초과하는 이름 후보의 개수가 복수개인 경우, 상기 복수개의 이름 후보의 우선 순위를 상기 신뢰도 점수에 기초하여 결정하고;
상기 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이와 제3임계값을 비교하고; 및
상기 비교 결과에 기초하여 상기 입력된 음성에 대응하는 이름을 선택하는 것;을 포함하는 차량의 제어방법.
The method of claim 16,
Selecting a name corresponding to the input voice among the at least one name candidate based on the determined threshold,
Determining the priority of the plurality of name candidates based on the reliability score when the number of name candidates having the reliability score exceeds a first threshold is plural;
Comparing the difference in reliability scores between the first and second priority name candidates and the third threshold; And
And selecting a name corresponding to the input voice based on the comparison result.
제19항에 있어서,
상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 것은,
상기 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이가 상기 제3임계값을 초과하면, 상기 우선 순위가 제1순위인 이름 후보를 상기 입력된 음성에 대응하는 이름으로 선택하는 것;을 포함하는 차량의 제어방법.
The method of claim 19,
Selecting a name corresponding to the input voice among the at least one name candidate based on the determined threshold,
When the difference in the reliability score between the first-ranked name candidate and the second-ranked name candidate exceeds the third threshold value, the first-ranked name candidate corresponds to the input voice. How to control the vehicle, including; to choose by name.
제19항에 있어서,
상기 적어도 하나의 이름 후보 중 상기 입력된 음성에 대응하는 이름을 상기 결정된 임계값에 기초하여 선택하는 것은,
상기 우선 순위가 제1순위인 이름 후보와 제2순위인 이름 후보 사이의 신뢰도 점수의 차이가 상기 제3임계값 이하이면, 상기 우선 순위가 제1순위인 이름 후보에 대한 확인을 상기 사용자에게 요청하는 것;을 포함하는 차량의 제어방법.
The method of claim 19,
Selecting a name corresponding to the input voice among the at least one name candidate based on the determined threshold,
If the difference in the reliability score between the first-ranked name candidate and the second-ranked name candidate is less than or equal to the third threshold, the user is requested to confirm the first-ranked name candidate. The control method of the vehicle comprising a.
제14항에 있어서,
적어도 하나의 이름 후보를 검색하는 것은,
상기 단말기의 폰북 정보가 수신되면, 상기 수신된 폰북 정보 중 상기 입력된 음성에 대응하는 적어도 하나의 이름 후보를 검색하고,
상기 적어도 하나의 이름 후보의 신뢰도 점수(confidence score)에 대한 임계값(threshold)을 사용자 패턴에 기초하여 결정하는 것은,
상기 검색된 이름 후보의 개수에 기초하여 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경하는 것;을 포함하는 차량의 제어방법.
The method of claim 14,
Searching for at least one name candidate,
When the phonebook information of the terminal is received, at least one name candidate corresponding to the input voice is searched among the received phonebook information,
Determining a threshold for a confidence score of the at least one name candidate based on a user pattern,
And changing at least one of a first threshold value, a second threshold value, or a third threshold value based on the number of searched name candidates.
제22항에 있어서,
상기 검색된 이름 후보의 개수에 기초하여 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경하는 것은,
상기 검색된 이름 후보의 개수가 미리 정해진 제1기준 개수 이하인 경우, 상기 제2임계값을 증가시키고, 상기 제3임계값을 감소시키는 것; 을 포함하는 차량의 제어방법.
The method of claim 22,
Changing at least one of the first threshold value, the second threshold value, or the third threshold value based on the number of searched name candidates,
Increasing the second threshold value and decreasing the third threshold value when the number of searched candidates is less than or equal to a predetermined first reference number; Control method of a vehicle comprising a.
제22항에 있어서,
상기 적어도 하나의 이름 후보의 신뢰도 점수(confidence score)에 대한 임계값(threshold)을 사용자 패턴에 기초하여 결정하는 것은,
상기 폰북 정보로부터 상기 검색된 이름 후보에 대한 카테고리의 개수를 확인하고, 상기 카테고리의 개수에 기초하여 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경하는 것;을 포함하는 차량의 제어방법.
The method of claim 22,
Determining a threshold for a confidence score of the at least one name candidate based on a user pattern,
Vehicle checking the number of categories for the searched name candidate from the phonebook information and changing at least one of a first threshold value, a second threshold value, or a third threshold value based on the number of categories. Control method.
제24항에 있어서,
상기 제1임계값, 제2임계값 또는 제3임계값 중 적어도 하나를 변경하는 것은,
상기 카테고리의 개수가 미리 정해진 제2기준 개수 이하인 경우, 상기 제2임계값을 증가시키고, 상기 제3임계값을 감소시키는 것; 을 포함하는 차량의 제어방법.
The method of claim 24,
Changing at least one of the first threshold value, the second threshold value, or the third threshold value,
If the number of categories is less than or equal to a predetermined second reference number, increasing the second threshold value and decreasing the third threshold value; Control method of a vehicle comprising a.
제14항에 있어서,
상기 선택된 이름에 대한 제어 명령을 상기 단말기로 전송하는 것;을 더 포함하는 차량의 제어방법.
The method of claim 14,
And transmitting a control command for the selected name to the terminal.
KR1020180136845A 2018-11-08 2018-11-08 Vehicle and controlling method thereof Active KR102613210B1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020180136845A KR102613210B1 (en) 2018-11-08 2018-11-08 Vehicle and controlling method thereof
US16/265,723 US11189276B2 (en) 2018-11-08 2019-02-01 Vehicle and control method thereof
CN201910185588.5A CN111161720B (en) 2018-11-08 2019-03-12 Vehicle and control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180136845A KR102613210B1 (en) 2018-11-08 2018-11-08 Vehicle and controlling method thereof

Publications (2)

Publication Number Publication Date
KR20200053341A true KR20200053341A (en) 2020-05-18
KR102613210B1 KR102613210B1 (en) 2023-12-14

Family

ID=70551822

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180136845A Active KR102613210B1 (en) 2018-11-08 2018-11-08 Vehicle and controlling method thereof

Country Status (3)

Country Link
US (1) US11189276B2 (en)
KR (1) KR102613210B1 (en)
CN (1) CN111161720B (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2020241459A1 (en) * 2019-05-30 2020-12-03
US11748629B2 (en) * 2020-01-21 2023-09-05 Moxa Inc. Device and method of handling anomaly detection
US11620993B2 (en) * 2021-06-09 2023-04-04 Merlyn Mind, Inc. Multimodal intent entity resolver
EP4210047A1 (en) * 2022-01-05 2023-07-12 Honeywell International Inc. Contextual editable speech recognition methods and systems
CN114067799A (en) * 2022-01-05 2022-02-18 广州小鹏汽车科技有限公司 Voice interaction method, terminal device, vehicle and storage medium
US20230267274A1 (en) * 2022-02-22 2023-08-24 Onetrust Llc Mapping entities in unstructured text documents via entity correction and entity resolution
CN115503639A (en) * 2022-10-13 2022-12-23 广州小鹏汽车科技有限公司 Voice processing method, voice interaction method, server and storage medium

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001186080A (en) * 1999-10-29 2001-07-06 Denso Corp Portable phone, portable phone system and communication method
US20050049860A1 (en) * 2003-08-29 2005-03-03 Junqua Jean-Claude Method and apparatus for improved speech recognition with supplementary information
KR20070113045A (en) * 2006-05-24 2007-11-28 엘지전자 주식회사 Speech recognition system and method
KR20160013720A (en) * 2014-07-28 2016-02-05 현대자동차주식회사 Speech recognition apparatus, vehicle having the same and speech recongition method
US20170294188A1 (en) * 2016-04-12 2017-10-12 Fujitsu Limited Apparatus, method for voice recognition, and non-transitory computer-readable storage medium
US20170351532A1 (en) * 2016-06-07 2017-12-07 Google Inc. Nondeterministic task initiation by a personal assistant module

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030020768A (en) * 2001-09-04 2003-03-10 주식회사 케이티 Description of automatic voice call connection service method by construction of personal phone book database using speech recognition and its related methods
US20060215821A1 (en) * 2005-03-23 2006-09-28 Rokusek Daniel S Voice nametag audio feedback for dialing a telephone call
US8521235B2 (en) * 2008-03-27 2013-08-27 General Motors Llc Address book sharing system and method for non-verbally adding address book contents using the same
CN101281745B (en) * 2008-05-23 2011-08-10 深圳市北科瑞声科技有限公司 Interactive system for vehicle-mounted voice
US8903714B2 (en) * 2011-12-21 2014-12-02 Nuance Communications, Inc. Concept search and semantic annotation for mobile messaging
US9053708B2 (en) * 2012-07-18 2015-06-09 International Business Machines Corporation System, method and program product for providing automatic speech recognition (ASR) in a shared resource environment
KR101572932B1 (en) * 2014-07-11 2015-11-30 현대자동차주식회사 Method and apparatus for controlling an origination call in vehicle using voice recognition function
KR101614756B1 (en) * 2014-08-22 2016-04-27 현대자동차주식회사 Apparatus of voice recognition, vehicle and having the same, method of controlling the vehicle
KR101675312B1 (en) * 2015-06-15 2016-11-11 현대자동차주식회사 Sound recognition apparatus, vehicle having the same and method thereof
US10810212B2 (en) * 2016-07-29 2020-10-20 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Validating provided information in a conversation

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001186080A (en) * 1999-10-29 2001-07-06 Denso Corp Portable phone, portable phone system and communication method
US20050049860A1 (en) * 2003-08-29 2005-03-03 Junqua Jean-Claude Method and apparatus for improved speech recognition with supplementary information
KR20070113045A (en) * 2006-05-24 2007-11-28 엘지전자 주식회사 Speech recognition system and method
KR20160013720A (en) * 2014-07-28 2016-02-05 현대자동차주식회사 Speech recognition apparatus, vehicle having the same and speech recongition method
US20170294188A1 (en) * 2016-04-12 2017-10-12 Fujitsu Limited Apparatus, method for voice recognition, and non-transitory computer-readable storage medium
US20170351532A1 (en) * 2016-06-07 2017-12-07 Google Inc. Nondeterministic task initiation by a personal assistant module

Also Published As

Publication number Publication date
CN111161720A (en) 2020-05-15
US11189276B2 (en) 2021-11-30
CN111161720B (en) 2024-10-18
KR102613210B1 (en) 2023-12-14
US20200152188A1 (en) 2020-05-14

Similar Documents

Publication Publication Date Title
KR102613210B1 (en) Vehicle and controlling method thereof
US8812316B1 (en) Speech recognition repair using contextual information
KR102643501B1 (en) Dialogue processing apparatus, vehicle having the same and dialogue processing method
US10297252B2 (en) Predicting and learning carrier phrases for speech input
CN109844740B (en) Follow-up voice query prediction
US7904298B2 (en) Predictive speech-to-text input
US8396709B2 (en) Speech recognition using device docking context
US9502032B2 (en) Dynamically biasing language models
KR102668438B1 (en) Speech processing apparatus, vehicle having the same and speech processing method
US11508367B2 (en) Dialogue system and dialogue processing method
CN105222797B (en) Utilize the system and method for oral instruction and the navigation system of partial match search
JP5688677B2 (en) Voice input support device
RU2701082C1 (en) Predictive retrieval of search results for voice requests
KR20180130670A (en) A vehicle-mounted voice recognition apparatus, a vehicle including the same, a vehicle-mounted voice recognition system and the method for the same
US20200321006A1 (en) Agent apparatus, agent apparatus control method, and storage medium
US20180350364A1 (en) Apparatus and method for determining operation based on context, vehicle for determining operation based on context, and method of controlling the vehicle
KR101001134B1 (en) Hangul Retrieval System and Method in Portable Terminal
KR100749088B1 (en) Interactive navigation system and its control method
KR20200076075A (en) Vehicle and control method thereof
KR20170089670A (en) Vehicle and control method for the same
KR20200109995A (en) A phising analysis apparatus and method thereof
AU2014200663B2 (en) Integration of embedded and network speech recognizers
KR20080086790A (en) Speech recognition based text message processing device and method in mobile terminal
WO2008064137A2 (en) Predictive speech-to-text input
EP3489952A1 (en) Speech recognition apparatus and system

Legal Events

Date Code Title Description
PA0109 Patent application

Patent event code: PA01091R01D

Comment text: Patent Application

Patent event date: 20181108

PG1501 Laying open of application
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20211029

Comment text: Request for Examination of Application

Patent event code: PA02011R01I

Patent event date: 20181108

Comment text: Patent Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20230523

Patent event code: PE09021S01D

E701 Decision to grant or registration of patent right
PE0701 Decision of registration

Patent event code: PE07011S01D

Comment text: Decision to Grant Registration

Patent event date: 20231127

PG1601 Publication of registration
OSZAR »