KR20050023941A - Audio/video apparatus and method for providing personalized services through voice recognition and speaker recognition - Google Patents
Audio/video apparatus and method for providing personalized services through voice recognition and speaker recognition Download PDFInfo
- Publication number
- KR20050023941A KR20050023941A KR1020030061511A KR20030061511A KR20050023941A KR 20050023941 A KR20050023941 A KR 20050023941A KR 1020030061511 A KR1020030061511 A KR 1020030061511A KR 20030061511 A KR20030061511 A KR 20030061511A KR 20050023941 A KR20050023941 A KR 20050023941A
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- user
- input
- command
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q9/00—Arrangements in telecontrol or telemetry systems for selectively calling a substation from a main station, in which substation desired apparatus is selected for applying a control signal thereto or for obtaining measured values therefrom
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Selective Calling Equipment (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
본 발명은 리모컨의 무선 마이크를 통해 사용자의 음성이 입력되면 상기 입력된 음성 신호에 대한 음성 인식 및 화자 인식을 수행하고, 입력된 명령어에 대한 판단을 수행하여 해당 사용자의 개별화된 서비스를 제공하는 A/V 장치로 구성되며, 사용자가 리모컨의 무선 마이크를 통해 음성을 입력하는 단계와, 상기 음성이 입력되면 입력된 음성과 음성을 입력한 화자를 인식하는 단계와, 상기 입력된 음성을 기초로 명령어를 판단하는 단계 및 상기 판단 결과에 따른 서비스를 제공하는 단계를 포함하는 것을 특징으로 한다.When the user's voice is input through the wireless microphone of the remote controller, the present invention performs voice recognition and speaker recognition on the input voice signal, and performs a judgment on the input command to provide a personalized service for the user. / V device, the user inputs a voice through a wireless microphone of the remote control, if the voice is input step of recognizing the input voice and the speaker who input the voice, based on the input voice command And determining a service and providing a service according to the determination result.
Description
본 발명은 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치 및 방법에 관한 것으로서, 특히 사용자의 음성이 입력되면 음성 인식 및 화자 인식을 동시에 수행하고, 화자 인식에 따른 개별화된 서비스를 제공하는 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치 및 방법에 관한 것이다. The present invention relates to an A / V apparatus and method for providing a personalized service through voice recognition and speaker recognition. In particular, when a user's voice is input, the present invention simultaneously performs voice recognition and speaker recognition, and personalized service according to speaker recognition. The present invention relates to an A / V apparatus and method for providing a personalized service through speech recognition and speaker recognition.
종래에는 개별화된 서비스를 제공받기 위해서, 사용자가 화자 인식 모드를 선택한 후 이미 등록해 놓은 암호(입력어)를 발성하여 사용자 인식을 수행하고, 그 다음 원하는 서비스를 제공받기 위해 해당 명령어를 발성함으로써, 개별화된 서비스를 제공 받았다. Conventionally, in order to provide a personalized service, the user selects a speaker recognition mode and then performs a user recognition by activating a registered password (input word), and then utters a corresponding command to receive a desired service. Personalized service was provided.
따라서, 사용자는 화자 인식을 위한 암호 입력 과정과, 음성 인식을 위한 명령어 입력 과정이라는 2단계 과정을 수행해야만 개별화된 서비스를 제공받을 수 있어 2단계 과정을 수행해야 하는 번거로움이 있었으며, 또한 화자 인식을 위한 입력어(암호)와 음성 인식을 위한 입력어(명령어)가 서로 다르게 적용되어 각각의 입력어를 항상 암기하고 있어야 하는 불편함이 있다. Therefore, the user has to perform a two-step process because the user can receive a personalized service only by performing a two-step process, a password input process for speaker recognition and a command input process for speech recognition. The input words (passwords) for and the input words (command words) for speech recognition are applied differently, and there is an inconvenience of memorizing each input word at all times.
또한, 다른 사용자가 개인화된 서비스를 제공 받고자 할 경우에, "사용자 전환"이라는 명령어를 입력한 후 화자 인식 및 음성 인식을 수행해야 하는 번거로움이 있다. In addition, when another user wants to receive a personalized service, it is troublesome to perform speaker recognition and speech recognition after inputting a command of "switch user".
본 발명은 상기한 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은 사용자의 음성이 입력되면 음성 인식 및 화자 인식을 동시에 수행함으로써, 별도의 사용자 인식 과정을 수행하지 않아도 되는 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치 및 방법을 제공하는 것이다. The present invention has been made to solve the above problems, an object of the present invention is to perform voice recognition and speaker recognition at the same time when the user's voice is input, speech recognition and speaker recognition does not need to perform a separate user recognition process It is to provide an A / V device and method for providing a personalized service through.
본 발명의 다른 목적은 음성 인식 및 화자 인식에 사용되는 입력어(명령어)를 동일하게 적용 함으로써, 원하는 서비스를 빠르게 제공 받을 수 있는 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치 및 방법을 제공하는 것이다.Another object of the present invention by applying the same input language (command) used for speech recognition and speaker recognition, the A / V device that provides a personalized service through the speech recognition and speaker recognition that can be provided quickly the desired service And a method.
상기 목적을 달성하기 위하여 본 발명은, 리모컨의 무선 마이크를 통해 사용자의 음성이 입력되면 상기 입력된 음성 신호에 대한 음성 인식 및 화자 인식을 수행하고, 입력된 명령어에 대한 판단을 수행하여 해당 사용자의 개별화된 서비스를 제공하는 A/V 장치로 구성된다. In order to achieve the above object, when the user's voice is input through the wireless microphone of the remote control, the present invention performs voice recognition and speaker recognition on the input voice signal, and performs a determination on the input command of the user. It consists of A / V devices that provide personalized services.
또한, 상기 A/V 장치는 상기 음성 입력부를 통해 입력된 음성을 인식하는 음성 인식부와, 상기 음성 입력부를 통해 입력된 음성을 기초로 사용자를 인식하는 화자 인식부와, 상기 음성 인식부가 인식한 음성이 어떠한 명령어 인지를 판단하는 판단부와, 상기 사용자 정보, 음성 정보, 사용자의 개별화된 서비스 정보 및 명령어를 저장하는 데이터베이스 및 상기 데이터베이스에서 상기 인식된 명령어 및 사용자의 개별화된 서비스 정보에 해당하는 서비스를 검색하는 서비스 검색부를 포함하는 것을 특징한다.The A / V device may further include a voice recognition unit for recognizing a voice input through the voice input unit, a speaker recognition unit for recognizing a user based on the voice input through the voice input unit, and a recognition of the voice recognition unit. A determination unit that determines which command is a voice, a database storing the user information, the voice information, the user's personalized service information and the command, and a service corresponding to the command recognized in the database and the user's personalized service information It characterized in that it comprises a service search unit for searching.
그리고, 사용자가 리모컨의 무선 마이크를 통해 음성을 입력하는 단계와, 상기 음성이 입력되면 입력된 음성과 음성을 입력한 화자를 인식하는 단계와, 상기 입력된 음성을 기초로 명령어를 판단하는 단계 및 상기 판단 결과에 따른 서비스를 제공하는 단계를 포함하는 것을 특징으로 한다. And, the user inputs a voice through a wireless microphone of the remote control, if the voice is input, the step of recognizing the input voice and the speaker who input the voice, determining the command based on the input voice and And providing a service according to the determination result.
이하, 본 발명의 바람직한 실시예를 첨부된 도면을 참조하여 상세히 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치를 개략적으로 나타낸 도면으로서, A/V 장치(200)는 음성 인식부(210), 화자 인식부(220), 제어부(230), 판단부(240), 서비스 검색부(250) 및 데이터베이스(260)로 구성된다. 1 is a view schematically showing an A / V device for providing a personalized service through speech recognition and speaker recognition according to the present invention, wherein the A / V device 200 includes a voice recognition unit 210 and a speaker recognition unit ( 220, a control unit 230, a determination unit 240, a service search unit 250, and a database 260.
A/V 장치(200)는 리모컨(100)의 무선 마이크를 통해 사용자의 음성이 입력되면 상기 입력된 음성 신호에 대한 음성 인식 및 화자를 인식하고, 입력된 명령어에 대한 판단을 수행하여 해당 사용자의 개별화된 서비스를 제공한다. When the user's voice is input through the wireless microphone of the remote controller 100, the A / V device 200 recognizes the voice recognition and the speaker of the input voice signal, and determines the input command to determine the user's voice. Provide personalized services.
음성 인식부(210)는 리모컨(100)에 구비된 음성 입력부(110)를 통해 입력된 음성을 인식하는 것으로서, 사용자가 입력한 명령어를 인식한다. The voice recognition unit 210 recognizes a voice input through the voice input unit 110 provided in the remote controller 100, and recognizes a command input by a user.
화자 인식부(220)는 음성 입력부(110)를 통해 입력된 음성을 기초로 화자를 인식하는 것으로서, 데이터베이스(260)에 저장된 사용자의 음성 정보를 통해 음성을 입력한 사용자를 인식한다. The speaker recognition unit 220 recognizes the speaker based on the voice input through the voice input unit 110, and recognizes the user who inputs the voice through voice information of the user stored in the database 260.
판단부(240)는 음성 인식부(210)가 인식한 음성이 어떠한 명령어인지를 판단하는 것으로서, 즉 음성 인식부(210)가 인식한 명령어를 분석하여 사용자 정보가 필요한 명령어인지, 사용자 정보가 필요없는 명령어인지를 판단한다. The determination unit 240 determines which command is a voice recognized by the voice recognition unit 210, that is, it is a command that requires user information by analyzing the command recognized by the voice recognition unit 210, and needs user information. Determine if the command is missing
데이터베이스(260)는 사용자 정보, 음성 정보, 사용자의 개별화된 서비스 정보 및 발생 가능한 명령어들을 저장하는 것으로서, 음성 인식부(210) 및 화자 인식부(220)에서 인증 수행 시 저장된 명령어 및 해당 사용자의 정보를 제공한다. 여기서, 발생 가능한 명령어는 사용자에 의해 입력될 수 있는 모든 명령어를 말하며, 예를 들어 채널 검색을 위한 명령어, 채널 등록을 위한 명령어 및 채널 삭제를 위한 명령어 등으로 이해될 수 있다.The database 260 stores user information, voice information, personalized service information of the user, and possible commands. The database 260 stores commands and information of the corresponding user when authentication is performed by the voice recognition unit 210 and the speaker recognition unit 220. To provide. Here, the command that can be generated refers to all commands that can be input by the user, and can be understood as, for example, a command for channel search, a command for channel registration, a command for channel deletion, and the like.
또한, 명령어는 사용자 인증 수행의 필요한 명령어와 그렇지 않은 명령어로 분리되어 저장되어 있다. 데이터베이스(260)에 저장된 명령어는 하기 도 3에서 자세히 설명한다. In addition, the command is divided into a command required for performing user authentication and a command not otherwise stored. Instructions stored in the database 260 are described in detail with reference to FIG. 3 below.
서비스 검색부(250)는 판단부(240)의 판단 결과에 따라 데이터베이스(260)에서 해당 명령어에 따른 정보 및 사용자의 개별화된 서비스 정보를 검색하는 것으로서, 즉 판단부(240)의 판단 결과에 따른 해당 서비스를 검색한다. The service retrieval unit 250 retrieves the information according to the command and the personalized service information of the user from the database 260 according to the determination result of the determination unit 240, that is, according to the determination result of the determination unit 240. Search for the service.
제어부(230)는 서비스 검색부(250)가 검색한 서비스를 제공하는 것으로서, 즉 사용자가 입력한 명령어에 대한 해당 서비스를 제공한다. 여기서, 해당 서비스는 선호 채널의 방송 프로그램 디스플레이, 추천 프로그램의 정보 디스플레이, 선호 음악 재생 및 선택한 음악의 장르 재생 등으로 이해될 수 있다. The controller 230 provides a service searched by the service search unit 250, that is, provides a corresponding service for a command input by a user. Here, the service may be understood as displaying a broadcast program of a preferred channel, displaying information of a recommended program, playing a favorite music, and playing a selected genre of music.
한편, 사용자의 음성은 리모컨(100)에 구비된 음성 입력부(110)를 통해 입력되며, 여기서 사용자의 음성 입력을 위하여 무선 마이크가 이용된다. On the other hand, the user's voice is input through the voice input unit 110 provided in the remote control 100, where a wireless microphone is used for the user's voice input.
도 2는 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법을 개략적으로 나타낸 순서도로서, 먼저 사용자가 리모컨에 구비된 무선 마이크를 통해 음성을 입력하면(S100), 음성 입력부(110)는 무선 마이크를 통해 입력된 사용자 음성(명령어)을 음성 인식부(210)로 전송한다. 2 is a flowchart schematically illustrating a method of providing a personalized service through voice recognition and speaker recognition according to the present invention. First, when a user inputs a voice through a wireless microphone provided in the remote controller (S100), the voice input unit ( 110 transmits a user voice (command) input through the wireless microphone to the voice recognition unit 210.
그 다음, 음성 입력부(110)가 전송한 명령어를 음성 인식부(210)가 인식함과 동시에 화자 인식부(220)는 입력된 음성을 통해 화자 인식을 수행한다(S110). 즉, 사용자가 입력한 명령어를 음성 인식부(210)가 인식을 하며, 이와 동시에 화자 인식부(220)가 입력된 음성을 통해 사용자에 대한 화자 인식을 한다. 여기서, 음성 인식부(210)는 입력된 명령어를 텍스트로 변환하여 판단부(240)로 전송하고, 화자 인식부(220)는 입력된 음성으로부터 특징 추출 및 분석을 수행한 후, 데이터베이스(260)에 저장된 사용자의 음성들 중에서 입력된 음성과 가장 근접한 음성 신호를 갖는 사용자의 음성을 검색하여 명령어를 입력한 사용자가 누구인지를 인식한다. 여기서, 화자 인식을 위해 사용자는 미리 사용자 등록 과정을 수행해야 하는데, 상기 사용자 등록을 통해 사용자의 특정 정보가 데이터베이스(260)에 등록되고, 이로써 음성을 통한 화자 인식을 수행할 수 있다. 그리고, 데이터베이스(260)에 등록되는 등록어는 개인화된 서비스를 필요로 하는 명령어들로 구성되며, 이로써 등록어와 명령어가 동일하게 적용되어 음성 인식과 화자 인식을 동시에 수행할 수 있다. Next, the voice recognition unit 210 recognizes the command transmitted by the voice input unit 110 and the speaker recognition unit 220 performs speaker recognition through the input voice (S110). That is, the voice recognition unit 210 recognizes the command input by the user, and at the same time, the speaker recognition unit 220 recognizes the speaker through the input voice. Here, the voice recognition unit 210 converts the input command into text and transmits it to the determination unit 240, and the speaker recognition unit 220 performs feature extraction and analysis from the input voice, and then the database 260. The voice of the user having the voice signal closest to the input voice among the user voices stored in the user is searched to recognize who is the user who inputs the command. Here, in order to recognize the speaker, the user needs to perform a user registration process in advance, and the specific information of the user is registered in the database 260 through the user registration, thereby performing speaker recognition through voice. In addition, the registered word registered in the database 260 is composed of commands requiring a personalized service. Thus, the registered word and the command may be applied in the same manner to simultaneously perform voice recognition and speaker recognition.
그 다음, 음성 인식부(210)가 인식한 명령어는 판단부(240)로 전송되고, 이에 판단부(240)는 음성 인식부(210)가 인식한 명령어를 분석한다(S120). 즉, 입력된 명령어가 어떤 동작의 수행을 명령하는 것인지를 분석하고, 분석된 명령어가 사용자 정보를 필요로 하는 사용자별로 개별화된 명령어인지 아니면 사용자 정보가 필요없는 일반적인 명령어인지를 판단한다. 여기서, 사용자별로 개별화된 명령어는 사용자의 취향 및 기호에 따라 사용자가 자주 입력하는 명령어로서, 선호 채널, 알림 예약, 알림 목록, 녹화 예약, 예약 목록, 녹화 목록, 추천 프로, 유료 채널 및 쇼핑 채널 등으로 이해될 수 있다. 그리고, 일반적인 명령어는 사용자의 취향 및 기호가 반영되지 않은 명령어로서, 뉴스, 드라마 및 스포츠 등으로 이해될 수 있다. Next, the command recognized by the voice recognition unit 210 is transmitted to the determination unit 240, and the determination unit 240 analyzes the command recognized by the voice recognition unit 210 (S120). In other words, it analyzes what operation the input command commands to perform, and determines whether the analyzed command is a command personalized for each user requiring user information or a general command without user information. Here, the commands personalized for each user are commands that are frequently input by the user according to the user's preferences and preferences, and include a favorite channel, a notification schedule, a notification list, a recording schedule, a reservation list, a recording list, a recommendation pro, a paid channel, and a shopping channel. It can be understood as. In addition, the general command is a command that does not reflect the user's taste and preference, and may be understood as news, drama, and sports.
그 다음, 판단부(240)의 판단 결과 입력된 명령어가 개별화된 서비스를 요청하는 명령어인 경우(S130), 서비스 검색부(250)는 음성을 입력한 사용자가 데이터베이스(260)에 등록되어 화자 인식부(220)를 통해 화자 인식이된 사용자인지를 판단한다(S140). Next, if the command inputted as a result of the determination of the determination unit 240 is a command for requesting a personalized service (S130), the service search unit 250 registers the user who inputs the voice in the database 260 to recognize the speaker. It is determined whether the speaker recognition is a user through the unit 220 (S140).
만일, 판단 결과 음성을 입력한 사용자가 데이터베이스(260)에 등록되어 있는 사용자인 경우(S140), 사용자 별로 등록된 데이터베이스(260)에서 화자 인식부(220)가 인증한 사용자의 정보를 검색 및 추출한 후, 추출된 사용자 정보에 저장된 서비스 목록 중에서 사용자가 입력한 명령어에 해당하는 개별화된 서비스를 검색한다(S150, S160). If the user who inputs the voice is a user registered in the database 260 as a result of the determination (S140), the speaker recognition unit 220 retrieves and extracts information of the user authenticated from the database 260 registered for each user. Thereafter, a personalized service corresponding to a command input by a user is searched among the service list stored in the extracted user information (S150 and S160).
그 다음, 제어부(230)가 서비스 검색부(250)로부터 검색된 개인화된 서비스를 사용자에게 제공한다(S170).Next, the controller 230 provides the personalized service retrieved from the service search unit 250 to the user (S170).
한편, 판단 결과 음성을 입력한 사용자가 데이터베이스(260)에 등록되어 있는 사용자가 아닌 경우(S140), 서비스 검색부(250)는 A/V 장치에 기본적으로 설정되어 있는 기본 서비스를 제공하거나(S190, S200), 또는 사용자에게 등록된 개별화된 서비스가 없음을 통보하고 사용자 등록을 수행하도록 요청한다(S210). 여기서, 기본적인 서비스란 개별화된 서비스에 있어서 음성을 입력한 사용자에 대한 사용자 등록이 이루어지지 않아, 음성을 입력한 사용자에게 제공할 개별화된 서비스가 없을 경우 제공하는 A/V 장치에 디폴트로 설정된 서비스를 말하는 것으로서, 데이터베이스(260)에 등록되지 않은 사용자에게 임시적으로 제공하는 것이다. 예를 들어, 사용자가 '추천 프로그램'을 입력한 경우 판단부(240)는 입력된 명령어를 분석하고, 분석결과 사용자가 입력한 명령어가 개별화된 서비스를 요청하는 명령어라는 판단 결과를 서비스 검색부(250)로 전송하고, 이에 서비스 검색부(250)는 음성을 입력한 사용자가 데이터베이스(260)에 등록되어 있는 사용자인지를 판단한다. If the user who inputs the voice is not the user registered in the database 260 as a result of the determination (S140), the service search unit 250 provides a basic service which is basically set in the A / V device (S190). S200), or notify the user that there is no registered personalized service and request to perform user registration (S210). Here, the basic service is a service set as a default in the A / V device provided when there is no personalized service for the user who inputs the voice because the user registration is not performed in the personalized service. In other words, the temporary provision is provided to a user who is not registered in the database 260. For example, when the user inputs the 'recommended program', the determination unit 240 analyzes the input command and determines that the command input by the user is a command for requesting a personalized service, and the service search unit ( 250, and the service search unit 250 determines whether the user who inputs the voice is a user registered in the database 260.
그 다음, 판단 결과 명령어('추천 프로그램')를 력한 사용자가 데이터베이스(260)에 등록되어 있지 않은 사용자로 판단되면, 해당 사용자에게 제공할 개별화된 서비스가 존재하지 않기 때문에 A/V 장치에 디폴트로 설정된 서비스(예를 들어, MBC 9시 뉴스)를 제공해 준다. Then, if it is determined that the user who inputs the command ('recommended program') is a user who is not registered in the database 260, since there is no personalized service to provide to the user, the A / V device defaults. It provides a set service (for example, MBC 9 o'clock news).
한편, 판단부(240)의 판단 결과 입력된 명령어가 일반적인 서비스를 요청하는 명령어인 경우(S130), 서비스 검색부(250)는 입력된 명령어에 해당하는 일반적인 서비스를 데이터베이스(260)에서 검색하고(S180), 이후 제어부(230)가 서비스 검색부(250)로부터 검색된 서비스를 사용자에게 제공한다(S170).On the other hand, if the command inputted as a result of the determination of the determination unit 240 is a command for requesting a general service (S130), the service search unit 250 searches for the general service corresponding to the input command in the database 260 ( In operation S180, the controller 230 provides a service searched from the service search unit 250 to the user in operation S170.
한편, 다른 사용자가 리모컨에 구비된 무선 마이크를 통해 명령어를 입력할 경우, 해당 사용자의 음성 및 화자 인식을 수행하여 검색된 사용자 정보에 따른 개별화된 서비스를 제공한다. On the other hand, when another user inputs a command through a wireless microphone provided in the remote control, it performs a voice and speaker recognition of the user to provide a personalized service according to the retrieved user information.
도 3은 본 발명에 따른 개별화된 명령어 테이블을 나타낸 도면으로서, 도 3(a)는 영상 기기(디지털 TV) 사용시 입력될 수 있는 개별화된 명령어를 나타낸 표이고, 도3 (b)는 음향 기기(오디오, MP3 재생기, 또는 멀티미디어 재생기 등) 사용시 입력될 수 있는 개별화된 명령어를 나타낸 표이다. 3 is a diagram illustrating a personalized command table according to the present invention, and FIG. 3 (a) is a table showing individualized commands that can be input when using a video device (digital TV), and FIG. 3 (b) is a sound device ( Audio, MP3 player, multimedia player, etc.) is a table showing the individualized commands that can be input when using.
먼저, 도 3(a)에 도시된 영상 기기 사용시 입력될 수 있는 개별화된 명령어를 나타낸 표를 살펴보자. First, look at a table showing individualized commands that can be input when using the video device shown in FIG.
선호채널(Favorite channel)은 사용자가 자신이 좋아하는 채널들을 데이터베이스(260)에 등록해 놓은 것으로, 즉 사용자가 명령어로 '선호채널' 이라고 입력하면 데이터베이스(260)에 저장된 선호채널 목록 중 어느 하나의 채널이 화면에 제공된다. Favorite channel is a user registers his favorite channels in the database 260, that is, when the user inputs the 'preferred channel' by the command of any one of the list of favorite channels stored in the database 260 The channel is presented on the screen.
알림(notify)예약은 사용자가 알림을 받고자 하는 임의의 프로그램에 대해서 방송 시작 전(후)에 방송의 시작을 알려주도록 설정하는 것으로, 즉 사용자가 해당 프로그램의 정보(방송시간, 채널 정보, 프로그램 제목 등)를 예약/입력하면, 해당 프로그램의 시작을 알려준다. Notify reservation is to set up to notify the start of broadcasting before (after) the start of any program for which the user wants to be notified, that is, the user's information (broadcast time, channel information, program title). Etc.), it will start the program.
알림목록은 사용자가 알림 예약 해놓은 프로그램 목록들을 데이터베이스(260) 등록 및 보관하는 목록으로서, 즉 사용자가 명령어로 '알림목록' 이라고 입력하면 등록된 알람 목록이 화면에 제공된다. 여기서, 해당 사용자의 요구에 따라 목록의 조작 및 가공이 가능하다.The notification list is a list for registering and storing a list of programs scheduled for notification by the user, that is, when the user inputs 'notification list' as a command, the registered alarm list is provided on the screen. Here, the list can be manipulated and processed according to the needs of the user.
녹화예약은 사용자가 보고자 하는 프로그램을 녹화 예약하는 것으로, 즉 사용자가 해당 프로그램의 정보(방송시간, 채널 정보, 프로그램 제목 등)를 입력하면, 설정된 시간에 해당 방송을 녹화해 준다.The recording schedule is to schedule recording of a program that the user wants to watch. That is, when the user inputs information (broadcast time, channel information, program title, etc.) of the corresponding program, the recording is recorded at the set time.
예약목록은 사용자가 녹화 예약 및 알림 예약해 놓은 프로그램 목록들을 데이터베이스(260)에 등록 및 보관하는 목록으로서, 즉 사용자가 명령어로 '예약목록' 이라고 입력하면 등록된 예약 목록이 화면에 제공된다. 여기서, 해당 사용자의 요구에 따라 목록의 조작 및 가공이 가능하다.The reservation list is a list in which the user registers and keeps a list of programs reserved for recording and notification in the database 260, that is, when the user inputs 'reservation list' as a command, the registered reservation list is provided on the screen. Here, the list can be manipulated and processed according to the needs of the user.
녹화목록은 녹화된 프로그램 목록들을 데이터베이스(260)에 등록 및 보관하는 목록으로서, 즉 사용자가 명령어로 '녹화목록' 이라고 입력하면 등록된 녹화 목록이 화면에 제공된다. 여기서, 사용자의 필요에 따라서 프로그램이 재생되거나 삭제될 수 있다.The recording list is a list of registering and storing the recorded program list in the database 260, that is, when the user inputs 'recording list' as a command, the registered recording list is provided on the screen. Here, the program may be played or deleted according to the needs of the user.
추천프로(Recommend program)은 사용자와 유사한 취향을 가진 다른 사람들이 추천한 프로그램에 대한 정보를 컨텐츠 제공 업체나 방송사로부터 제공받아 등록해 놓은 것으로, 즉 사용자가 명령어로 '추천프로' 라고 입력하면 사용자에게 추천된 프로그램 및 관련 정보가 제공된다.Recommend program is a registered program that receives information about programs recommended by others with similar tastes from a content provider or broadcaster. Recommended programs and related information are provided.
유료채널(Pay Per View)은 사용자가 유료 채널을 탐색하거나 시청할 때, 사용자 식별(화자 인식)을 통해 개인정보에 따라 시청가능 여부를 판단하여, 시청 가능한 해당 정보를 제공한다. Pay Per View, when a user browses or views a paid channel, determines whether the user can watch based on personal information through user identification (speaker recognition), and provides the corresponding viewable information.
성인채널(Adult channel)은 연령 제한이 있는 채널을 탐색하거나 시청할 때, 사용자 식별(화자 인식)을 통해 개인정보에 따라 시청가능 여부를 판단하여, 시청 가능한 사용자인 경우에만 해당 정보를 제공한다. When searching for or watching a channel with an age restriction, an adult channel determines whether the user can view the video based on personal information through user identification (speaker recognition), and provides the corresponding information only when the user can view the video.
쇼핑채널(Shopping channel)은 TV 상거래를 수행하려고 할 때, 사용자 식별(화자 인식)을 통해 개인정보에 따라 상거래 이용가능 여부를 판단하여, 이용 가능한 사용자인 경우에만 해당 정보를 제공한다. When a shopping channel attempts to perform TV commerce, the shopping channel determines whether the commerce is available according to personal information through user identification (speaker recognition), and provides the corresponding information only when the user is available.
도 3(b)에 도시된 음향 기기 사용시 입력될 수 있는 개별화된 명령어를 나타낸 표를 살펴보자.Let's look at a table showing individualized commands that can be input when using the acoustic device shown in FIG.
재생(Play)은 사용자 식별(화자 인식)을 통해 발성한 사용자의 프로필 정보에 따라 개인화된 노래 목록들을 재생 주는 것으로, 즉 사용자가 명령어로 '재생'이라고 입력하면 재생 목록에 등록된 노래를 재생해 준다.Play plays a list of personalized songs according to the user's profile information, which is generated through user identification (speaker recognition). In other words, if the user enters 'Play' as a command, the song registered in the playlist is played. give.
장르별 선택은 가요, 재즈, 클래식, 팝 등 장르별로 개인화된 서비스를 제공하는 것으로, 즉 사용자가 명령어로 여러 장르중 하나(예를 들어, 가요)를 입력하면, 해당 장르(가요)의 음악을 재생 해준다.Selecting by genre provides personalized services by genre such as song, jazz, classic, and pop, that is, when a user enters one of several genres (for example, song) with a command, the music of the genre (song) is played. Do it.
선호곡(Favorite song list)은 사용자가 자신이 좋아하는 노래들을 데이터베이스(260)에 등록해 놓은 것으로, 즉 사용자가 명령어로 '선호곡'이라고 입력하면 등록된 선호곡이 재생된다.Favorite song list is a user has registered his favorite songs in the database 260, that is, if the user inputs a 'favorite song' as a command, the registered favorite song is played.
한편, 사용자는 상기에서 설명한 명령어 이외에 다른 명령어를 입력 및 등록할 수 있다. Meanwhile, the user may input and register other commands in addition to the commands described above.
도 4는 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법의 일 실시예를 나타낸 도면으로서, 먼저 사용자가 스포츠 뉴스 채널을 시청하던 중 리모컨에 구비된 무선 마이크에 '선호 채널'이라고 말하면, 음성 입력부(110)는 사용자가 입력한 '선호 채널'이라는 명령어를 음성 인식부(210)로 전송한다. 4 is a diagram illustrating an embodiment of a method for providing a personalized service through voice recognition and speaker recognition according to the present invention. First, a user prefers a 'preferred channel' to a wireless microphone provided in a remote controller while watching a sports news channel. ', The voice input unit 110 transmits a command' preferred channel 'input by the user to the voice recognition unit 210.
그 다음, 음성 인식부(210)는 입력된 '선호 채널'이라는 명령어를 인식하고, 이와 동시에 화자 인식부(220)는 입력된 음성을 통해 화자 인식을 수행한다. Next, the voice recognition unit 210 recognizes the input 'preferred channel' command, and at the same time, the speaker recognition unit 220 performs speaker recognition through the input voice.
그 다음, 음성 입력부(210)는 판단부(240)에 입력된 명령어('선호 채널')를 전송하고, 판단부(240)는 전송된 명령어를 분석한다. 여기서, 판단부(240)는 명령어를 분석함으로써, 전송된 명령어가 '선호 채널'을 청하는 명령어이며, 분석된 '선호 채널'이라는 명령어가 사용자 정보를 필요로 하는 개별화된 명령어라는 것을 서비스 검색부(250)로 전송한다. Next, the voice input unit 210 transmits a command ('preferred channel') input to the determination unit 240, and the determination unit 240 analyzes the transmitted command. Here, the determination unit 240 by analyzing the command, the transmitted command is a command for requesting a 'preferred channel,' the service search unit that the analyzed command 'preferred channel' is a personalized command requiring user information. Send to 250.
이에, 서비스 검색부(250)는 화자 인식부(220)가 인식한 사용자에 해당하는 사용자 정보를 데이터베이스(260)에서 추출하고, 추출된 사용자 정보에 저장된 서비스 목록 중에서 '선호 채널' 목록을 검색한다. Accordingly, the service search unit 250 extracts user information corresponding to the user recognized by the speaker recognition unit 220 from the database 260 and searches for a 'preferred channel' list among the service list stored in the extracted user information. .
그 다음, 제어부(230)가 검색된 선호 채널(예를 들어, '야인시대')을 사용자에게 제공한다. Next, the controller 230 provides the searched preferred channel (eg, 'night time') to the user.
한편, 사용자가 '야인시대'를 시청하다가 다시 '선호채널'이라고 명령어를 입력하면 선호 채널 목록들 중 '야인시대'와 가장 근접한 번호를 갖는 '한밤의 TV 연예'로 채널이 변경된다(도4에 도시된 테이블 참조). On the other hand, when the user watches the 'night time' and enters the command 'preferred channel' again, the channel is changed to 'the night's TV entertainment' having the number closest to the 'night time' in the preferred channel list (Fig. 4). See the table shown in).
또한, 사용자가 '야인시대'를 시청하다가 아래로(또는 위로)라고 명령어를 입력하면 아래 등록되어 있는 '한밤의 TV 연예' 채널로 화면이 변경된다.In addition, when the user watches the 'night time' and inputs a command to down (or up), the screen is changed to the 'night TV entertainment' channel registered below.
도 5는 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법의 다른 실시예를 나타낸 도면으로서, 다수의 사용자가 음성 입력을 통해 원하는 채널의 서비스를 제공 받은 과정을 나타낸 것이다.FIG. 5 is a diagram illustrating another embodiment of a method for providing a personalized service through voice recognition and speaker recognition according to the present invention, and illustrates a process in which a plurality of users are provided with a service of a desired channel through voice input.
먼저, 사용자가 TV를 시청하던 중 리모컨에 구비된 무선 마이크에 '선호채널'이라고 말하면, 음성 인식부(210) 및 화자 인식부(220)는 입력된 '선호채널'이라는 명령어를 통해 음성 인식 및 화자 인식을 수행한다. First, when a user is watching TV and speaks a 'preferred channel' to a wireless microphone provided in the remote controller, the voice recognition unit 210 and the speaker recognition unit 220 recognize the voice through the input 'preferred channel' command. Perform speaker recognition.
그 다음, 판단부(240)는 입력된 명령어를 분석하여 사용자가 원하는 서비스가 무엇인지를 판단하고, 판단 결과 입력된 명령어가 개별화된 서비스를 요청하는 '선호채널'이라는 것을 서비스 검색부(250)로 전송한다. Next, the determination unit 240 analyzes the input command to determine what service the user wants, and as a result, the service search unit 250 determines that the input command is a 'preferred channel' requesting a personalized service. To send.
이에, 서비스 검색부(250)는 사용자의 데이터베이스(260)에 저장된 서비스 목록 중에서 '선호채널' 목록을 검색하여 해당 채널(예를 들어, 개그 콘서트)을 사용자에게 제공해 준다.Accordingly, the service search unit 250 searches for a 'preferred channel' list from the service list stored in the user's database 260 and provides a corresponding channel (eg, a gag concert) to the user.
이 후, 다른 사용자가 리모컨에 구비된 무선 마이크에 '선호채널'이라고 말하면, 음성 인식부(210) 및 화자 인식부(220)는 입력된 '선호채널'이라는 명령어를 통해 음성 인식 및 화자 인식을 수행는데, 이때 화자 인식을 통해 명령어를 입력한 사용자가 동일한 사용자가 아니라는 것을 판단한다.Thereafter, when another user says 'preferred channel' to the wireless microphone provided in the remote controller, the voice recognition unit 210 and the speaker recognition unit 220 perform voice recognition and speaker recognition through the input 'preferred channel' command. In this case, the speaker recognition determines that the user who inputs the command is not the same user.
그 다음, 판단부(240)는 사용자가 입력한 명령어를 분석하여 분석된 결과를 서비스 검색부(250)로 다시 전송하고, 서비스 검색부(250)는 해당 사용자의 데이터베이스(260)에 저장된 서비스 목록 중에서 '선호채널' 목록을 검색하여 해당 채널(예를 들어, 여름 향기)을 사용자에게 제공해 준다.Next, the determination unit 240 analyzes the command input by the user and transmits the analyzed result back to the service search unit 250, and the service search unit 250 stores a list of services stored in the database 260 of the user. Search for the 'preferred channel' list and provide the channel (eg, summer scent) to the user.
본 발명의 바람직한 또 다른 실시예로 사용자가 오디오를 통해 음악을 들을 경우를 설명하면, 먼저 사용자가 오디오 리모컨에 구비된 무선 마이크에 '재즈'라는 명령어를 입력하면, 음성 입력부(110)는 사용자가 입력한 '재즈'라는 명령어를 음성 인식부(210)로 전송한다. According to another preferred embodiment of the present invention, when the user listens to music through audio, first, when the user inputs a command of 'jazz' to the wireless microphone provided in the audio remote controller, the voice input unit 110 The input 'jazz' command is transmitted to the voice recognition unit 210.
그 다음, 음성 입력부(210)는 입력된 '재즈'라는 명령어를 인식하고, 이와 동시에 화자 인식부(220)는 입력된 음성을 통해 사용자에 대한 화자 인식을 수행한다.Next, the voice input unit 210 recognizes the input 'jazz' command, and at the same time, the speaker recognition unit 220 performs speaker recognition for the user through the input voice.
그 다음, 음성 입력부(210)는 판단부(240)에 입력된 명령어(재즈)를 전송하고, 판단부(240)는 전송된 명령어를 분석한다. 여기서, 판단부(240)는 명령어(재즈)를 분석하여 서비스 검색부(250)로 전송한다. Next, the voice input unit 210 transmits a command (jazz) input to the determination unit 240, and the determination unit 240 analyzes the transmitted command. Here, the determination unit 240 analyzes the command (jazz) and transmits it to the service search unit 250.
이에, 서비스 검색부(250)는 화자 인식부(220)가 인식한 사용자에 해당하는 사용자 정보를 데이터베이스(260)에서 추출하고, 추출된 사용자 정보에 저장된 음악 장르 중에서 '재즈'를 검색하여 재생시킨다. Accordingly, the service search unit 250 extracts user information corresponding to the user recognized by the speaker recognition unit 220 from the database 260, and searches and plays 'jazz' among music genres stored in the extracted user information. .
이상에서 본 발명에 대하여 상세히 기술하였지만, 본 발명이 속하는 기술 분야에 있어서 통상의 지식을 가진 사람이라면, 첨부된 청구범위에 정의된 본 발명의 정신 및 범위를 벗어나지 않으면서 본 발명을 여러 가지로 변형 또는 변경하여 실시할 수 있음은 자명하며, 따라서 본 발명의 실시예에 따른 단순한 변경은 본 발명의 기술을 벗어날 수 없을 것이다.Although the present invention has been described in detail above, those skilled in the art to which the present invention pertains may variously modify the present invention without departing from the spirit and scope of the present invention as defined in the appended claims. It is apparent that the present invention may be modified or modified. Therefore, a simple change according to an embodiment of the present invention will not be possible without departing from the technology of the present invention.
상기한 바와 같이 이루어진 본 발명에 따르면, 무선 마이크를 통해 사용자 음성 입력시, 음성 인식 및 화자 인식을 동시에 수행함으로써, 별도의 사용자 인식 과정을 수행하지 않고 개인화된 서비스를 검색해 주어 빠르게 원하는 서비스를 제공받을 수 있는 효과가 있다. According to the present invention made as described above, by performing a voice recognition and speaker recognition at the same time when the user voice input through the wireless microphone, to search for a personalized service without performing a separate user recognition process to receive a desired service quickly It can be effective.
또한, 음성 인식 및 화자 인식에 사용되는 입력어(명령어)를 동일하게 적용 함으로써, 사용자는 인증 수행을 위한 입력어를 암기하지 않아도 되며, 음성 인식과 화자 인식을 위한 별도의 장치를 구비하지 않아도 되는 효과가 있다. In addition, by applying the same input words (command words) used for speech recognition and speaker recognition, the user does not need to memorize input words for performing authentication, and does not have to provide a separate device for speech recognition and speaker recognition. It works.
도 1은 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 A/V 장치를 개략적으로 나타낸 도면.1 is a diagram schematically illustrating an A / V device for providing a personalized service through voice recognition and speaker recognition according to the present invention.
도 2는 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법을 개략적으로 나타낸 순서도. 2 is a flowchart schematically illustrating a method for providing a personalized service through voice recognition and speaker recognition according to the present invention.
도 3은 본 발명에 따른 명령어 테이블을 나타낸 도면. 3 illustrates an instruction table in accordance with the present invention.
도 4는 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법의 일 실시예를 나타낸 도면. 4 is a diagram illustrating an embodiment of a method for providing a personalized service through voice recognition and speaker recognition according to the present invention.
도 5는 본 발명에 따른 음성 인식 및 화자 인식을 통한 개별화된 서비스를 제공하는 방법의 다른 실시예를 나타낸 도면.5 illustrates another embodiment of a method for providing a personalized service through speech recognition and speaker recognition according to the present invention.
<도면의 주요 부분에 관한 부호의 설명><Explanation of symbols on main parts of the drawings>
100 : 리모컨 110 : 음성 입력부100: remote controller 110: voice input unit
200 : A/V 장치 210 : 음성 인식부200: A / V device 210: speech recognition unit
220 : 화자 인식부 230 : 제어부 220: speaker recognition unit 230: control unit
240 : 판단부 250 : 서비스 제공부240: determination unit 250: service provider
260 : 데이터베이스260: database
Claims (8)
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030061511A KR20050023941A (en) | 2003-09-03 | 2003-09-03 | Audio/video apparatus and method for providing personalized services through voice recognition and speaker recognition |
JP2004188859A JP2005078072A (en) | 2003-09-03 | 2004-06-25 | Av device and its method in which individualized service is provided through voice recognition and speaker recognition |
EP04254257A EP1513136A1 (en) | 2003-09-03 | 2004-07-15 | Audio/video apparatus and method for providing personalized services through voice and speaker recognition |
US10/899,052 US20050049862A1 (en) | 2003-09-03 | 2004-07-27 | Audio/video apparatus and method for providing personalized services through voice and speaker recognition |
CNB2004100740661A CN1300765C (en) | 2003-09-03 | 2004-09-02 | Audio/video apparatus and method for providing personalized services |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030061511A KR20050023941A (en) | 2003-09-03 | 2003-09-03 | Audio/video apparatus and method for providing personalized services through voice recognition and speaker recognition |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20050023941A true KR20050023941A (en) | 2005-03-10 |
Family
ID=34132228
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030061511A Ceased KR20050023941A (en) | 2003-09-03 | 2003-09-03 | Audio/video apparatus and method for providing personalized services through voice recognition and speaker recognition |
Country Status (5)
Country | Link |
---|---|
US (1) | US20050049862A1 (en) |
EP (1) | EP1513136A1 (en) |
JP (1) | JP2005078072A (en) |
KR (1) | KR20050023941A (en) |
CN (1) | CN1300765C (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100913130B1 (en) * | 2006-09-29 | 2009-08-19 | 한국전자통신연구원 | Method and device for speech recognition service using user profile |
KR101531848B1 (en) * | 2013-11-20 | 2015-06-29 | 금오공과대학교 산학협력단 | User Focused Navigation Communication Device |
US9484029B2 (en) | 2014-07-29 | 2016-11-01 | Samsung Electronics Co., Ltd. | Electronic apparatus and method of speech recognition thereof |
WO2018131752A1 (en) * | 2017-01-11 | 2018-07-19 | (주)파워보이스 | Personalized voice recognition service providing method using artificial intelligent automatic speaker identification method, and service providing server used therein |
KR101891698B1 (en) * | 2018-03-02 | 2018-08-27 | 주식회사 공훈 | A speaker identification system and method through voice recognition using location information of the speaker |
Families Citing this family (118)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8238881B2 (en) | 2001-08-07 | 2012-08-07 | Waloomba Tech Ltd., L.L.C. | System and method for providing multi-modal bookmarks |
US8213917B2 (en) | 2006-05-05 | 2012-07-03 | Waloomba Tech Ltd., L.L.C. | Reusable multimodal application |
US8694322B2 (en) * | 2005-08-05 | 2014-04-08 | Microsoft Corporation | Selective confirmation for execution of a voice activated user interface |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9928510B2 (en) * | 2006-11-09 | 2018-03-27 | Jeffrey A. Matos | Transaction choice selection apparatus and system |
US20070156853A1 (en) * | 2006-01-03 | 2007-07-05 | The Navvo Group Llc | Distribution and interface for multimedia content and associated context |
WO2007081682A2 (en) * | 2006-01-03 | 2007-07-19 | The Navvo Group Llc | Distribution of multimedia content |
US20070157285A1 (en) * | 2006-01-03 | 2007-07-05 | The Navvo Group Llc | Distribution of multimedia content |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US20080156173A1 (en) * | 2006-12-29 | 2008-07-03 | Harman International Industries, Inc. | Vehicle infotainment system with personalized content |
JP4538756B2 (en) | 2007-12-03 | 2010-09-08 | ソニー株式会社 | Information processing apparatus, information processing terminal, information processing method, and program |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
KR101556594B1 (en) * | 2009-01-14 | 2015-10-01 | 삼성전자 주식회사 | Speech recognition method in signal processing apparatus and signal processing apparatus |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
DE102009051508B4 (en) * | 2009-10-30 | 2020-12-03 | Continental Automotive Gmbh | Device, system and method for voice dialog activation and guidance |
US8886541B2 (en) * | 2010-02-04 | 2014-11-11 | Sony Corporation | Remote controller with position actuatated voice transmission |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US20110307250A1 (en) * | 2010-06-10 | 2011-12-15 | Gm Global Technology Operations, Inc. | Modular Speech Recognition Architecture |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
CN103187053B (en) * | 2011-12-31 | 2016-03-30 | 联想(北京)有限公司 | Input method and electronic equipment |
US8453058B1 (en) * | 2012-02-20 | 2013-05-28 | Google Inc. | Crowd-sourced audio shortcuts |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
KR20130140423A (en) * | 2012-06-14 | 2013-12-24 | 삼성전자주식회사 | Display apparatus, interactive server and method for providing response information |
US9288421B2 (en) * | 2012-07-12 | 2016-03-15 | Samsung Electronics Co., Ltd. | Method for controlling external input and broadcast receiving apparatus |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101922663B1 (en) | 2013-06-09 | 2018-11-28 | 애플 인크. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
JP6348903B2 (en) * | 2013-06-10 | 2018-06-27 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Speaker identification method, speaker identification device, and information management method |
KR20150012464A (en) * | 2013-07-25 | 2015-02-04 | 삼성전자주식회사 | Display apparatus and method for providing personalized service thereof |
US9900177B2 (en) | 2013-12-11 | 2018-02-20 | Echostar Technologies International Corporation | Maintaining up-to-date home automation models |
US20150163411A1 (en) | 2013-12-11 | 2015-06-11 | Echostar Technologies, Llc | Home Monitoring and Control |
US9769522B2 (en) | 2013-12-16 | 2017-09-19 | Echostar Technologies L.L.C. | Methods and systems for location specific operations |
US9450812B2 (en) | 2014-03-14 | 2016-09-20 | Dechnia, LLC | Remote system configuration via modulated audio |
US9723393B2 (en) | 2014-03-28 | 2017-08-01 | Echostar Technologies L.L.C. | Methods to conserve remote batteries |
US10089985B2 (en) * | 2014-05-01 | 2018-10-02 | At&T Intellectual Property I, L.P. | Smart interactive media content guide |
US20150336786A1 (en) * | 2014-05-20 | 2015-11-26 | General Electric Company | Refrigerators for providing dispensing in response to voice commands |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9338493B2 (en) * | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9621959B2 (en) | 2014-08-27 | 2017-04-11 | Echostar Uk Holdings Limited | In-residence track and alert |
US9824578B2 (en) | 2014-09-03 | 2017-11-21 | Echostar Technologies International Corporation | Home automation control using context sensitive menus |
US9989507B2 (en) | 2014-09-25 | 2018-06-05 | Echostar Technologies International Corporation | Detection and prevention of toxic gas |
JP6129134B2 (en) * | 2014-09-29 | 2017-05-17 | シャープ株式会社 | Voice dialogue apparatus, voice dialogue system, terminal, voice dialogue method, and program for causing computer to function as voice dialogue apparatus |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9983011B2 (en) | 2014-10-30 | 2018-05-29 | Echostar Technologies International Corporation | Mapping and facilitating evacuation routes in emergency situations |
US9511259B2 (en) | 2014-10-30 | 2016-12-06 | Echostar Uk Holdings Limited | Fitness overlay and incorporation for home automation system |
CN104505091B (en) * | 2014-12-26 | 2018-08-21 | 湖南华凯文化创意股份有限公司 | Man machine language's exchange method and system |
US9967614B2 (en) | 2014-12-29 | 2018-05-08 | Echostar Technologies International Corporation | Alert suspension for home automation system |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9729989B2 (en) | 2015-03-27 | 2017-08-08 | Echostar Technologies L.L.C. | Home automation sound detection and positioning |
US9948477B2 (en) | 2015-05-12 | 2018-04-17 | Echostar Technologies International Corporation | Home automation weather detection |
US9946857B2 (en) | 2015-05-12 | 2018-04-17 | Echostar Technologies International Corporation | Restricted access for home automation system |
US9632746B2 (en) | 2015-05-18 | 2017-04-25 | Echostar Technologies L.L.C. | Automatic muting |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
KR102398488B1 (en) * | 2015-06-26 | 2022-05-13 | 엘지전자 주식회사 | Mobile terminal capable of remotely controlling a plurality of device |
CN105183778A (en) * | 2015-08-11 | 2015-12-23 | 百度在线网络技术(北京)有限公司 | Service providing method and apparatus |
US9960980B2 (en) | 2015-08-21 | 2018-05-01 | Echostar Technologies International Corporation | Location monitor and device cloning |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US9996066B2 (en) | 2015-11-25 | 2018-06-12 | Echostar Technologies International Corporation | System and method for HVAC health monitoring using a television receiver |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10101717B2 (en) | 2015-12-15 | 2018-10-16 | Echostar Technologies International Corporation | Home automation data storage system and methods |
US9798309B2 (en) | 2015-12-18 | 2017-10-24 | Echostar Technologies International Corporation | Home automation control based on individual profiling using audio sensor data |
CN106920546B (en) * | 2015-12-23 | 2020-03-20 | 小米科技有限责任公司 | Method and device for intelligently recognizing voice |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10091017B2 (en) | 2015-12-30 | 2018-10-02 | Echostar Technologies International Corporation | Personalized home automation control based on individualized profiling |
US10073428B2 (en) | 2015-12-31 | 2018-09-11 | Echostar Technologies International Corporation | Methods and systems for control of home automation activity based on user characteristics |
US10060644B2 (en) | 2015-12-31 | 2018-08-28 | Echostar Technologies International Corporation | Methods and systems for control of home automation activity based on user preferences |
CN107407809B (en) * | 2016-01-26 | 2020-04-14 | 深圳市柔宇科技有限公司 | Head-mounted device, earphone device and head-mounted device separation control method |
CN105551491A (en) * | 2016-02-15 | 2016-05-04 | 海信集团有限公司 | Voice recognition method and device |
US9628286B1 (en) | 2016-02-23 | 2017-04-18 | Echostar Technologies L.L.C. | Television receiver and home automation system and methods to associate data with nearby people |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
KR20190016536A (en) * | 2016-06-06 | 2019-02-18 | 시러스 로직 인터내셔널 세미컨덕터 리미티드 | Voice user interface |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179588B1 (en) | 2016-06-09 | 2019-02-22 | Apple Inc. | Intelligent automated assistant in a home environment |
US9882736B2 (en) | 2016-06-09 | 2018-01-30 | Echostar Technologies International Corporation | Remote sound generation for a home automation system |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
CN107527613A (en) * | 2016-06-21 | 2017-12-29 | 中兴通讯股份有限公司 | A kind of video traffic control method, mobile terminal and service server |
US10294600B2 (en) | 2016-08-05 | 2019-05-21 | Echostar Technologies International Corporation | Remote detection of washer/dryer operation/fault condition |
US10049515B2 (en) | 2016-08-24 | 2018-08-14 | Echostar Technologies International Corporation | Trusted user identification and management for home automation systems |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
JP6760394B2 (en) | 2016-12-02 | 2020-09-23 | ヤマハ株式会社 | Content playback equipment, sound collection equipment, and content playback system |
WO2018101458A1 (en) * | 2016-12-02 | 2018-06-07 | ヤマハ株式会社 | Sound collection device, content playback device, and content playback system |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
CN107147618B (en) * | 2017-04-10 | 2020-05-15 | 易视星空科技无锡有限公司 | User registration method and device and electronic equipment |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | Far-field extension for digital assistant services |
US11961534B2 (en) | 2017-07-26 | 2024-04-16 | Nec Corporation | Identifying user of voice operation based on voice information, voice quality model, and auxiliary information |
JP2019193134A (en) * | 2018-04-26 | 2019-10-31 | シャープ株式会社 | Display device, television receiver and display method |
US11017782B2 (en) * | 2018-11-14 | 2021-05-25 | XMOS Ltd. | Speaker classification |
CN118609546A (en) | 2018-12-03 | 2024-09-06 | 谷歌有限责任公司 | Text-independent speaker identification |
JP7254316B1 (en) | 2022-04-11 | 2023-04-10 | 株式会社アープ | Program, information processing device, and method |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5717743A (en) * | 1992-12-16 | 1998-02-10 | Texas Instruments Incorporated | Transparent telephone access system using voice authorization |
US5774859A (en) * | 1995-01-03 | 1998-06-30 | Scientific-Atlanta, Inc. | Information system having a speech interface |
US5719921A (en) * | 1996-02-29 | 1998-02-17 | Nynex Science & Technology | Methods and apparatus for activating telephone services in response to speech |
AU2385700A (en) * | 1998-12-29 | 2000-07-31 | Alcatel Usa Sourcing, L.P. | Security and user convenience through voice commands |
US6314398B1 (en) * | 1999-03-01 | 2001-11-06 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method using speech understanding for automatic channel selection in interactive television |
US6324512B1 (en) * | 1999-08-26 | 2001-11-27 | Matsushita Electric Industrial Co., Ltd. | System and method for allowing family members to access TV contents and program media recorder over telephone or internet |
US6339706B1 (en) * | 1999-11-12 | 2002-01-15 | Telefonaktiebolaget L M Ericsson (Publ) | Wireless voice-activated remote control device |
CN1101025C (en) * | 1999-11-19 | 2003-02-05 | 清华大学 | Phonetic command controller |
CN1123862C (en) * | 2000-03-31 | 2003-10-08 | 清华大学 | Speech recognition special-purpose chip based speaker-dependent speech recognition and speech playback method |
DE60120062T2 (en) * | 2000-09-19 | 2006-11-16 | Thomson Licensing | Voice control of electronic devices |
DE10111121B4 (en) * | 2001-03-08 | 2005-06-23 | Daimlerchrysler Ag | Method for speaker recognition for the operation of devices |
FR2823361A1 (en) * | 2001-04-05 | 2002-10-11 | Thomson Licensing Sa | METHOD AND DEVICE FOR ACOUSTICALLY EXTRACTING A VOICE SIGNAL |
WO2002086865A1 (en) * | 2001-04-13 | 2002-10-31 | Koninklijke Philips Electronics N.V. | Speaker verification in a spoken dialogue system |
US7519534B2 (en) * | 2002-10-31 | 2009-04-14 | Agiletv Corporation | Speech controlled access to content on a presentation medium |
-
2003
- 2003-09-03 KR KR1020030061511A patent/KR20050023941A/en not_active Ceased
-
2004
- 2004-06-25 JP JP2004188859A patent/JP2005078072A/en active Pending
- 2004-07-15 EP EP04254257A patent/EP1513136A1/en not_active Ceased
- 2004-07-27 US US10/899,052 patent/US20050049862A1/en not_active Abandoned
- 2004-09-02 CN CNB2004100740661A patent/CN1300765C/en not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100913130B1 (en) * | 2006-09-29 | 2009-08-19 | 한국전자통신연구원 | Method and device for speech recognition service using user profile |
KR101531848B1 (en) * | 2013-11-20 | 2015-06-29 | 금오공과대학교 산학협력단 | User Focused Navigation Communication Device |
US9484029B2 (en) | 2014-07-29 | 2016-11-01 | Samsung Electronics Co., Ltd. | Electronic apparatus and method of speech recognition thereof |
WO2018131752A1 (en) * | 2017-01-11 | 2018-07-19 | (주)파워보이스 | Personalized voice recognition service providing method using artificial intelligent automatic speaker identification method, and service providing server used therein |
KR20180082783A (en) * | 2017-01-11 | 2018-07-19 | (주)파워보이스 | Method for Providing Personalized Voice Recognition Service Using Artificial Intellignent Speaker Recognizing Method, and Service Providing Server Used Therein |
US11087768B2 (en) | 2017-01-11 | 2021-08-10 | Powervoice Co., Ltd. | Personalized voice recognition service providing method using artificial intelligence automatic speaker identification method, and service providing server used therein |
KR101891698B1 (en) * | 2018-03-02 | 2018-08-27 | 주식회사 공훈 | A speaker identification system and method through voice recognition using location information of the speaker |
Also Published As
Publication number | Publication date |
---|---|
CN1300765C (en) | 2007-02-14 |
US20050049862A1 (en) | 2005-03-03 |
EP1513136A1 (en) | 2005-03-09 |
CN1591571A (en) | 2005-03-09 |
JP2005078072A (en) | 2005-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20050023941A (en) | Audio/video apparatus and method for providing personalized services through voice recognition and speaker recognition | |
US11425469B2 (en) | Methods and devices for clarifying audible video content | |
US10721345B2 (en) | Entertainment systems and methods | |
US7519534B2 (en) | Speech controlled access to content on a presentation medium | |
US20190333515A1 (en) | Display apparatus, method for controlling the display apparatus, server and method for controlling the server | |
US20040083490A1 (en) | Program recommendation system, program recommendation method and program for realizing the same | |
US7756916B2 (en) | Display method | |
US20080133696A1 (en) | Personal multi-media playing system | |
JP2006507614A (en) | Personal audio recording system | |
JP2007178927A (en) | Information retrieving device and method | |
KR20140055502A (en) | Broadcast receiving apparatus, server and control method thereof | |
JP7488192B2 (en) | Receiving device and control method | |
US20030191629A1 (en) | Interface apparatus and task control method for assisting in the operation of a device using recognition technology | |
WO2021018212A1 (en) | Electronic apparatus having notification function, and control method for electronic apparatus | |
US20060085371A1 (en) | System and method for associating different types of media content | |
JP2016062560A (en) | Electronic apparatus and control method thereof | |
JP3525855B2 (en) | Voice recognition method and voice recognition device | |
JP2012203773A (en) | Moving image recommendation device and moving image recommendation method | |
KR100499032B1 (en) | Audio And Video Edition Using Television Receiver Set | |
JP2003219332A (en) | Program reservation apparatus and method, and program | |
JP2005005900A (en) | Program retrieval device and method | |
JP3807577B2 (en) | Man-machine interface system | |
JP7132974B2 (en) | Video display device | |
JP2002252813A (en) | Program retrieving unit and program retrieving program | |
US9386254B2 (en) | Broadcast method and broadcast apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20030903 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20050808 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20060213 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20050808 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |