WO2017150836A1 - Image generation system and method for real-time laryngeal videostroboscopy, high speed videolaryngoscopy, and plane scan digital kymography - Google Patents

Image generation system and method for real-time laryngeal videostroboscopy, high speed videolaryngoscopy, and plane scan digital kymography Download PDF

Info

Publication number
WO2017150836A1
WO2017150836A1 PCT/KR2017/001876 KR2017001876W WO2017150836A1 WO 2017150836 A1 WO2017150836 A1 WO 2017150836A1 KR 2017001876 W KR2017001876 W KR 2017001876W WO 2017150836 A1 WO2017150836 A1 WO 2017150836A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
camera
laryngeal
trigger
scan digital
Prior art date
Application number
PCT/KR2017/001876
Other languages
French (fr)
Korean (ko)
Inventor
왕용진
강덕훈
Original Assignee
왕용진
강덕훈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020160162835A external-priority patent/KR101908632B1/en
Application filed by 왕용진, 강덕훈 filed Critical 왕용진
Publication of WO2017150836A1 publication Critical patent/WO2017150836A1/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/04Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor combined with photographic or television appliances
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B1/00Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor
    • A61B1/267Instruments for performing medical examinations of the interior of cavities or tubes of the body by visual or photographical inspection, e.g. endoscopes; Illuminating arrangements therefor for the respiratory tract, e.g. laryngoscopes, bronchoscopes

Definitions

  • the present invention relates to an image generating technique for vocal cord examination, which accurately observes the movement of the vocal cords using a high-speed camera with an external trigger function, and simultaneously observes images of real-time laryngeal stroboscopy, high-speed laryngoscope, and planar scan digital chymography. It also relates to a possible image generation system and method.
  • Vocal vocal vibration evaluation which directly observes the larynx, can be divided into morphological and functional tests.
  • Morphological modality includes laryngeal videostroboscopy (LVS) and high speed videolaryngoscopy (HSV), and functional methods include laryngeal videostrobokymography, Line scanning videokymography (VKG), two dimensional scanning videokymography (2DVKG), and digital kymography (DKG).
  • LVS laryngeal videostroboscopy
  • HSV high speed videolaryngoscopy
  • functional methods include laryngeal videostrobokymography, Line scanning videokymography (VKG), two dimensional scanning videokymography (2DVKG), and digital kymography (DKG).
  • VKG Line scanning videokymography
  • 2DVKG two dimensional scanning videokymography
  • DKG digital kymography
  • Laryngeal stroboscopy not only helps diagnose voice disorders, but also plays an important role in determining voice and surgical treatment. However, it is impossible to test itself if it is not a real image and there is no periodicity or if there is no continuous speech for 3-5 seconds due to lung disease.
  • laryngeal stroboscopy has limitations in the use of patients without periodicity, and the limitation of sampling rate that can be recorded does not show all cycles of the vocal cords, such as ultrafast laryngoscope findings. Many features of the vocal cords, which cannot be observed by examination, can be observed and are of better image quality than ultrafast laryngoscopy. In addition, ease of use, cost effectiveness, and the advantage of obtaining synchronized voice feedback have been widely used in clinical practice to date.
  • HSV is capable of recording at high frame rates of more than 2,000 frames per second and color images are the ideal test for morphological diagnosis such as laryngeal inflammation and laryngeal vitiligo evaluation, but recordable time is a few seconds and file size is very large. Because of its size, it takes more than 30 minutes to play after recording, and evaluation of the played video is not easy. There is also a lack of quantitative variables to assess the type and degree of irregularity of vocal cord movement.
  • Patent Document 1 Korean Patent Publication No. 2003-0046787
  • Non-Patent Document 1 Svec J, Schutte H. Videokymography: high-speed line scanning of vocal fold vibration. J Voice. 1996; 10: 201-205.
  • Non-Patent Document 2 Hirose H. High-speed digital imaging of vocal fold vibration. Acta Otolaryngol Suppl. 1988; 458: 151-153.
  • An object of the present invention is to observe the rapid movement of the vocal cords using the external trigger function of the high speed camera, to obtain information about one cycle of the vocal cords, and at the same time both the images of laryngeal stroboscopy and planar scan digital chimography in real time.
  • the present invention provides an image generation system that enables morphological and functional evaluation of vocal cords.
  • An object of the present invention is to provide an image generating system configured to be substantially equal to the fundamental frequency.
  • a first aspect of the present invention provides an image generating system for real-time laryngeal sproboscopy, high-speed laryngoscope, and planar scan digital chymography, comprising: a light source device for emitting a continuous light source for illuminating the vocal cords; A camera having a function of an external trigger and photographing the vocal cords; And an image observation server configured to generate a laryngeal stroboscopic image or a planar scan digital chymograph image based on the image photographed from the camera according to whether the external trigger operates.
  • the light source device can emit light of a continuous light source corresponding to the xenon light source.
  • the camera may correspond to a high speed camera that acquires an image of 600 frames per second.
  • the image observation server, laryngeal stroboscopic image generation unit for generating a laryngeal stroboscopic image for the vocal cords when the function of the external trigger of the camera operates; And when the function of the external trigger of the camera does not operate, it may include a planar scan digital chymography image generating unit for generating a planar scan digital chymography image for the vocal cords.
  • the laryngeal stroboscopic image generating unit includes a voice signal receiving module for receiving a voice signal of a subject; A trigger frequency setting module for setting a trigger frequency based on a fundamental frequency of the voice signal; A trigger signal providing module for providing a trigger signal to the camera according to the trigger frequency; An image receiving module which receives an image photographed by the camera according to the trigger signal; And an image generation module for generating the laryngeal stroboscopic image by combining the received images.
  • the voice signal receiving module may receive the voice signal from a voice detector or a microphone attached to the center of the neck under the annular cartilage of the subject.
  • the trigger frequency setting module sets a value obtained by adding or subtracting a specific frequency to the basic frequency as the trigger frequency, and the specific frequency may correspond to 1 Hz to 0.5 Hz.
  • the image receiving module receives a still image of one frame corresponding to a specific part in an image of a continuous period according to the movement of the vocal cords, which is captured by the camera according to the trigger signal, and receives the received image.
  • Still images may be sequentially stored, but the still images may be sampled within a specific frequency in the image of the continuous period.
  • the image generating module may generate the virtual image of one cycle of the movement of the vocal cords by combining the stored still images.
  • the planar scan digital chymography image generating unit comprises: an image receiving module configured to receive an image photographed by the camera; A pixel information extraction module configured to set a target area and a unit pixel from the image, and extract pixel information of each frame according to the target area and the unit pixel; A frame generation module configured to combine the pixel information of each extracted frame to generate a frame for constructing the planar scan digital chymograph image; And an image generation module that generates the planar scan digital chymograph image by combining the frames.
  • whether the external trigger of the camera is operated may be switched in real time.
  • a second aspect of the present invention for achieving the above object is performed in an image generating system for real-time laryngeal sproboscopy, high-speed laryngoscopy, and planar scan digital chymography, comprising a light source device, a camera, and an image observation server.
  • a method of generating an image comprising: (a) checking whether an external trigger function of the camera is operated; And (b) generating a laryngeal stroboscopic image or a planar scan digital chymograph image based on the image photographed from the camera according to whether the external trigger operates.
  • the step (b) comprises: (b-1) generating a laryngeal stroboscopic image of the vocal cords when the function of the external trigger of the camera is operated; And (b-2) generating a planar scan digital chymograph image of the vocal cords when the function of the external trigger of the camera does not operate.
  • step (b-1) comprises: receiving a voice signal of a subject; Setting a trigger frequency based on a fundamental frequency of the voice signal; Providing a trigger signal to the camera according to the trigger frequency; Receiving an image photographed by the camera according to the trigger signal; And combining the received images to generate the laryngeal stroboscopy image.
  • step (b-2) comprises: receiving an image photographed by the camera; Setting a target region and a unit pixel from the image, and extracting pixel information of each frame according to the target region and unit pixel; Generating a frame to compose the planar scan digital chymograph image by combining pixel information of each extracted frame; And combining the frames to generate a planar scan digital chymograph image.
  • a system incorporating laryngeal stroboscopy, high-speed laryngoscopy, and planar-scan digital chymography, as well as laryngeal stroboscopy and high-speed laryngoscopy is a functional image form of planar-scan digital chemography It combines the advantages of laryngeal scaffolding, which can acquire planar scan digital chymography while feeding back voice and video using the high-speed laryngoscope function, and the laryngeal stroboscopy function. Since the recording of the roboscopic image is possible, it is effective to provide the clinician with useful and specific information in a short time.
  • FIG. 1 is a block diagram of an image generation system according to a preferred embodiment of the present invention.
  • FIG. 2 is a block diagram of the image observing server of FIG. 1.
  • FIG. 3 is a flowchart illustrating an image generating method of laryngeal stroboscopic image performed in the image generating system of FIG. 1.
  • FIG. 4 is a flowchart illustrating an image generating method of a planar scan digital chymography image performed in the image generating system of FIG. 1.
  • FIG. 5 is an exemplary diagram for describing a still image captured by a camera according to a trigger signal.
  • FIG. 6 is an exemplary diagram illustrating a fast laryngeal endoscope image and a multi-frame laryngeal stroboscopy image.
  • FIG. 7 is another exemplary diagram illustrating a fast laryngeal endoscope image and a laryngeal stroboscopic image generated by the present invention.
  • first, second, etc. are used to describe various elements, components and / or sections, these elements, components and / or sections are of course not limited by these terms. These terms are only used to distinguish one element, component or section from another element, component or section. Therefore, the first device, the first component, or the first section mentioned below may be a second device, a second component, or a second section within the technical spirit of the present invention.
  • an identification code (eg, a, b, c, etc.) is used for convenience of description, and the identification code does not describe the order of the steps, and each step is clearly specified in context. Unless stated in order, it may occur differently from the stated order. That is, each step may occur in the same order as specified, may be performed substantially simultaneously, or may be performed in the reverse order.
  • FIG. 1 is a block diagram of an image generation system according to a preferred embodiment of the present invention.
  • the image generating system 100 includes a light source device 110, a laryngoscope 120, a camera 130, and an image observing server 150.
  • the light source device 110 is a device for illuminating the vocal cords
  • the laryngoscope 120 is a mechanism for observing the vocal cords, and an image of the vocal cords is observed by the light source device 110 and the laryngoscope 120.
  • the light source device 110 may emit a continuous light source for illuminating the vocal cords, for example, may emit a continuous light source corresponding to a Xenon light source.
  • the laryngoscope 120 may be implemented integrally with the camera 130 to be described below.
  • the camera 130 is connected to the light source device 110 and the laryngoscope 120 to photograph, record, and store images of the larynx including the vocal cords and the gates.
  • the camera 130 may correspond to a high speed camera that acquires an image of 600 frames per second, and may be, for example, a high speed CCD camera or a global shutter type CMOS camera.
  • the camera 130 may have a function of an external trigger, wherein the external trigger function is for directly determining the moment of acquiring the image.
  • a camera without an external trigger function acquires images at the same interval of 1/30 seconds when acquiring a still image of 30 frames per second, but not 1/30 seconds using a camera with an external trigger function. Still images may be acquired at different time intervals.
  • the external trigger function may be implemented in a hardware method and a software method.
  • the trigger device 140 is connected to the camera 130, and the camera device 130 is a still image in the trigger device 140. It is possible to determine when to obtain.
  • a time point for acquiring a still image may be determined by a program controlling the camera 130.
  • the external trigger function may control the camera 130 in the image observation server 150.
  • a time point for acquiring a still image may be determined by a program.
  • the image observation server 150 is an apparatus for receiving images captured by the camera 130 and generating images for real-time laryngeal stroboscopy, high-speed laryngoscope, and planar scan digital chymography.
  • the image observing server 150 may generate a laryngeal stroboscopic image or a planar scan digital chymograph image based on the image captured by the camera 130 according to whether the external trigger of the camera 130 operates.
  • the image observation server 150 is an image generated in connection with the display device, that is, a high-speed laryngeal endoscope image 161, a multi-frame laryngeal stroboscopy image 162, a planar scan digital chimography image 163, and a high speed
  • the image 164 combined with the laryngoscope image and the planar scan digital chymograph image may be output, and the images may be stored in an internal storage device of the image observation server 150 or an external storage device connected to the image observation server 150. And manage.
  • FIG. 2 is a block diagram of the image observing server of FIG. 1.
  • the image observing server 150 includes a laryngeal stroboscopic image generator 210, a planar scan digital chymography image generator 220, and a controller 230, and the controller 230 is a laryngeal larynx.
  • the operation of the stroboscope image generator 210 and the planar scan digital chymograph image generator 220 controls the flow of data.
  • the image observation server 150 may basically generate a high-speed laryngoscopy image, and the method for generating a high-speed laryngoscope image is based on conventional techniques, and thus, the present invention will not be described in detail.
  • the laryngeal stroboscopic image generation unit 210 generates a laryngeal stroboscopic image of the vocal cords when the external trigger function of the camera 130 operates, and receives a voice signal receiving module 211 and a trigger frequency setting module. 212, a trigger signal providing module 213, an image receiving module 214, and an image generating module 215.
  • planar scan digital chymography image generator 220 when the function of the external trigger of the camera 130 does not operate, the planar scan digital chymography image generator 220 generates a plane scan digital chymography image for the vocal cords, and receives the image receiving module 221 and the pixel.
  • the function of the external trigger of the camera 130 is operated (step S310).
  • whether to operate the function of the external trigger may be set by the user.
  • the voice and vibration signal receiving module 211 receives a voice and vibration signal of the examinee (step S320).
  • the subject may be provided with a vibration detector in the center of the neck under the cartilaginous cartilage or may be provided with a microphone connected to the image observation server 150, and the voice signal receiving module 211 may be connected to the vibration detector or microphone when the subject speaks.
  • the voice signal of the input subject may be received.
  • the trigger frequency setting module 212 sets the trigger frequency based on the fundamental frequency of the voice signal (step S330).
  • the trigger frequency setting module 212 sets a threshold frequency plus a specific frequency as the trigger frequency.
  • the specific frequency may correspond to 0.5 Hz to 1 Hz.
  • the trigger frequency setting module 212 may add a specific frequency to the fundamental frequency. Is to set the value to the trigger frequency.
  • the trigger signal providing module 213 provides a trigger signal to the camera 130 according to the trigger frequency (step S340). That is, the trigger signal providing module 213 provides a trigger signal to the camera 130 when the still image is captured so that the camera 130 can capture a still image according to the trigger frequency.
  • the shutter speed of the camera 130 may be adjusted to a 1 / 1,000 second or 1 / 2,000 second duration.
  • the image receiving module 214 receives an image captured by the camera according to the trigger signal (step S350).
  • the image receiving module 214 receives a still image of one frame corresponding to a specific portion in the image of the continuous period according to the movement of the vocal cords, which is captured by the camera 130 according to the trigger signal, and here
  • still images can be sampled within a certain frequency in a series of images.
  • the received still images may be sequentially stored.
  • the image captured by the camera 130 may be stored in a PC connected to a USB 3.0 high-speed digital camera or a medical image storage transmission device (MediView SDHD, U-medical, Korea). have.
  • the image generating module 215 combines the images received by the image receiving module 214 to generate a laryngeal stroboscopic image (S360).
  • the image generation module 215 may combine the stored still images to generate a laryngeal stroboscopic image corresponding to a virtual image of one cycle of the movement of the vocal cords.
  • the image generation module 215 may store the generated laryngeal stroboscopic image in an internal storage device or an external storage device, or output it to a display device connected to the image observation server 150.
  • the camera 130 may provide a trigger signal provided by the trigger signal providing module 213.
  • a still image of one frame corresponding to the specific portions 511 to 513 may be captured in continuous and periodic movement of the vocal cords.
  • the image receiving module 214 sequentially receives and stores still images of each frame corresponding to 511 to 513 photographed by the camera 130, and the image generating module 215 corresponds to the stored 511 to 513.
  • One cycle of the image 520 may be generated by combining the still images of each frame.
  • the laryngeal stroboscopic image generation unit 210 of the image observation server 150 sets the trigger frequency based on the fundamental frequency corresponding to the speech frequency of the subject's vocal cords through steps S320 to S360, By adjusting the image sampling rate of the camera 130 using an external trigger according to the trigger frequency, a high-speed video image captured by a high-speed camera of 2,000 frames or more per second by configuring the number of images per cycle of the vocal cord vibration close to the fundamental frequency A laryngeal straw conservative nosebleed image can be generated that exhibits the same effect.
  • the vocal cords of the subject move 150 times per second, and the trigger frequency is set to 151 Hz with a delay of 1 Hz from the fundamental frequency, thereby moving the vocal cords of the subject for 1 second.
  • the external trigger function 75 still images can be obtained.
  • the trigger frequency is set to 150.5 Hz, which is delayed by 0.5 Hz from the fundamental frequency, and the motion of the subject's vocal cords is acquired using an external trigger function for 150 seconds, 150 still images may be obtained.
  • MF LVS Multi-frame laryngeal videostroboscopy
  • the function of the external trigger of the camera 130 is not operated (step S410).
  • whether to operate the function of the external trigger may be set by the user.
  • the image receiving module 221 receives an image photographed by the camera 130 (step S420).
  • the image receiving module 221 may convert the laryngoscope analog image photographed in real time from the camera 130 into high-speed laryngoscope digital image data to obtain in real time.
  • the image receiving module 221 may load a laryngoscope image pre-stored in an internal storage device or an external storage device of the image observation server 150.
  • the pixel information extraction module 222 sets a target area and a unit pixel from the received image, and extracts pixel information of each frame according to the target area and the unit pixel (step S430).
  • the target area is an area of which part of the high-speed laryngoscopy image is to be generated as a planar scan digital chymography image
  • the unit pixel corresponds to at least one predetermined pixel constituting a predetermined pixel line or a pixel line of the target area. In this case, it is a unit serving as a reference for extracting pixel information for each frame of the fast laryngeal endoscope image.
  • the pixel information extraction module 222 may set format information, for example, a frame rate, of a planar scan digital chymography image to be generated.
  • the pixel information extraction module 222 may extract pixel information every frame by the set unit pixel from the first frame of the high-speed laryngoscope image.
  • the pixel information extraction module 222 extracts pixel information of a specific frame from among frames of the high-speed laryngeal endoscope image, and extracts pixel information to extract pixel information from the next position of the location from which the pixel information is extracted. Can be determined by location. That is, the pixel information extraction position is determined as the next position of the pixel position extracted in the previous frame, and the movement of the pixel information extraction position is determined as one of the top to bottom, top to bottom, top to bottom, and bottom to be constant in every frame. Is moved in the direction.
  • the frame generation module 223 combines the extracted pixel information of each frame to generate a frame for constructing a planar scan digital chymography image (step S440).
  • the frame generation module 223 uses the pixel information of each extracted frame of the high-speed laryngeal endoscope image according to the pixel information extraction position from which the pixel information is extracted, and the pixel at the pixel position corresponding to the frame of the planar scan digital chymography image.
  • the pixel information extraction process may be performed on all frames of the high-speed laryngeal endoscope image to generate frames of the planar scan digital chymograph image.
  • the frame generation module 223 may correct brightness, saturation, blurring, sharpness, or rotation of a frame of the generated planar scan digital chymograph image.
  • the image generation module 224 combines the frames to generate a planar scan digital chymography image (step S450).
  • the image generation module 224 may store the generated planar scan digital chymography image in an internal storage device or an external storage device, or output the generated flat scan digital chymography image to a display device connected to the image observation server 150.
  • whether the external trigger of the camera 130 is operated may be switched in real time by the user. That is, since the function of the external trigger of the camera 130 can be switched in real time during the image acquisition, the planar scan digital chymography by the planar scan digital chymography image generator 220 performed in a state where the trigger function is not operated. Switching of the laryngeal stroboscopic image generation method by the laryngeal stroboscopic image generation unit 210 which is performed while the image generation method and the trigger function are operated is possible in real time without a large delay time.
  • FIG. 6 is an exemplary diagram illustrating a fast laryngeal endoscope image and a multi-frame laryngeal stroboscopy image.
  • 160 still images obtained by photographing the vocal cords of a subject whose basic frequency corresponds to 160 Hz, that is, 160 Hz, are captured by the camera 130.
  • a high-speed laryngeal endoscope image captured by the 1,350 FPS camera 130 generates 160 still images for about 0.12 seconds, and the movement of the vocal cords in one cycle is about 9 still images. Appears.
  • the high-speed laryngoscope image corresponding to (a) of FIG. 6 is photographed, the corresponding image may be confirmed through a display device in real time.
  • the frame indicated by the solid red line is photographed by a conventional laryngeal stroboscopic imaging apparatus photographing at about 30 frames per second.
  • the conventional laryngeal stroboscopy imaging apparatus captures only one frame indicated by a solid red line while being photographed.
  • 160 still images are generated for one second from a multi-frame laryngeal stroboscopic image obtained by the laryngeal stroboscopic image generator 210 of the image observation server 150.
  • the movement of the vocal cords of the cycle is represented by 160 still images. That is, in the multi-frame laryngeal stroboscopy image according to the present invention, the movement of one vocal cord is composed of the number of frames which is almost equal to the phonation frequency.
  • the laryngeal stroboscopic image corresponding to (b) of FIG. 6 is photographed, the image may be confirmed in real time through the display device, and thus, the shape of the vocal cords is visually confirmed while the vocal cord is moved through the display device. Can be.
  • the laryngeal stroboscopy image generated by the conventional laryngeal stroboscopy image capturing apparatus is composed of about 35 frames of movement of one vocal cord.
  • FIG. 7 is another exemplary diagram illustrating a fast laryngeal endoscope image and a laryngeal stroboscopic image generated by the present invention.
  • the still images obtained by capturing the vocal cords of a test subject having a basic frequency of 100 Hz, that is, 100 Hz, by the camera 130 are arranged in chronological order, and the function of the external trigger does not operate.
  • the fast laryngeal endoscope image 710 obtained in the case and the multi-frame laryngeal stroboscopic images 720 and 730 obtained when the function of the external trigger operates.
  • the movement of the vocal cords of one cycle is represented by both four still images, and as described with reference to FIG.
  • the shape of is hard to see clearly.
  • the image is obtained according to the time obtained from the first frame to the 10th frame
  • the multi-frame laryngeal stroboscopic image 730 is the time obtained from the first frame to the 101st frame. It shows the image according to.
  • the acquired image is omitted between the first frame and the 100th frame of the multi-frame laryngeal stroboscopic image 730
  • the image from the first frame to the 10th frame of the multi-frame laryngeal stroboscopic image 720 is obtained. do.
  • the maximum number of frames acquired is about 8,000 frames per second (8,000 FPS), and most of the still images of about 3,000 frames can be obtained.
  • the resolution of the image is also very small.
  • laryngoscope images are taken with the corresponding 8,000 FPS camera with comfortable vocalization (male: approx. 125 Hz, female: approx. 200 Hz) in adult men and women, 64 men and 40 women Still images could be obtained.
  • the camera 130 according to the present invention that is, laryngoscope images of the same target using a 600 ⁇ 1,550 FPS camera of VGA resolution supporting laryngeal stroboscopy technology
  • 125 men and 200 women Still images can be acquired.
  • the resolution of the still image is also VGA-class, resulting in a better image quality than the 8,000 FPS camera.
  • 600 still images may be acquired with respect to voice utterance of a subject corresponding to a maximum of 600 Hz.
  • still images may be acquired at a maximum of 1,550 FPS, and in this environment, 1,550 for a voice of a subject corresponding to a maximum of 1,550 Hz may be obtained. Intestinal still images may be obtained.
  • the image generating method according to an embodiment of the present invention can also be implemented as computer-readable code on a computer-readable recording medium.
  • the computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored.
  • a computer-readable recording medium may be a ROM, a RAM, a CD-ROM, a magnetic tape, a hard disk, a floppy disk, a removable storage device, a nonvolatile memory (Flash memory).
  • Flash memory nonvolatile memory
  • the computer readable recording medium can also be distributed over computer systems connected through a computer communication network and stored and executed as readable code in a distributed fashion.
  • voice and vibration signal receiving module 212 trigger frequency setting module
  • trigger signal providing module 214 video receiving module
  • image receiving module 222 pixel information extraction module
  • frame generation module 224 image generation module

Abstract

The present invention relates to an image generation system for real-time laryngeal videostroboscopy, high speed laryngoscopy, and plane scan digital kymography, comprising: a light source device for emitting a continuous light source for illuminating the vocal cords; a camera including an external trigger function and photographing the vocal cords; and an image observation server for generating, according to whether the external trigger is operated, a laryngeal videostroboscopy image or a plane scan digital kymography image on the basis of the image captured by the camera.

Description

실시간 후두스트로보스코피, 고속 후두내시경 검사, 및 평면 스캔 디지털 카이모그래피를 위한 영상 생성 시스템 및 방법Image generation system and method for real-time laryngeal stroboscopy, high-speed laryngeal endoscopy, and planar scan digital chymography
본 발명은 성대 검사를 위한 영상 생성 기술에 관한 것으로서, 외부 트리거 기능이 있는 고속 카메라를 이용하여 성대의 움직임을 정확하게 관찰하고, 동시에 실시간 후두 스트로보스코피, 고속 후두경 검사, 평면 스캔 디지털 카이모그래피의 영상 관찰도 가능한 영상 생성 시스템 및 방법에 관한 것이다. The present invention relates to an image generating technique for vocal cord examination, which accurately observes the movement of the vocal cords using a high-speed camera with an external trigger function, and simultaneously observes images of real-time laryngeal stroboscopy, high-speed laryngoscope, and planar scan digital chymography. It also relates to a possible image generation system and method.
사람의 성대는 대략 초당 100회에서 300회 정도로 빠르게 진동하기 때문에 육안으로의 평가는 불가능하다. 그러므로 빠른 성대의 움직임을 느린 속도로 볼 수 있게 할 필요가 있다. 직접 후두를 관찰하는 성대 진동 평가 방법은 형태학적 (morphological) 검사와 기능적(functional) 검사로 나눌 수 있다. 형태학적 방법 (morphological modality)에는 후두스트로보스코피(laryngeal videostroboscopy, LVS)와 고속 후두내시경 검사(high speed videolaryngoscopy, HSV)가 있으며, 기능적인 방법(functional method)에는 후두 비디오스트로보카이모그라피(laryngeal videostrobokymography), 라인 스캐닝 비디오카이모그라피(line scanning videokymography(VKG)), 2차원 스캐닝 비디오카이모그라피(two dimensional scanning videokymography(2DVKG)), 디지털 카이모그라피(digital kymography (DKG))등이 있다. 임상 실습에서 아직도 가장 많이 사용되고 있는 이미징양식(imaging modality)은 후두 스트로보스코피이다.Human vocal cords vibrate quickly, approximately 100 to 300 times per second, so visual evaluation is impossible. Therefore, it is necessary to be able to see the movement of the fast vocal cords at a slow speed. Vocal vocal vibration evaluation, which directly observes the larynx, can be divided into morphological and functional tests. Morphological modality includes laryngeal videostroboscopy (LVS) and high speed videolaryngoscopy (HSV), and functional methods include laryngeal videostrobokymography, Line scanning videokymography (VKG), two dimensional scanning videokymography (2DVKG), and digital kymography (DKG). The most commonly used imaging modality in clinical practice is laryngeal stroboscopy.
후두 스트로보스코피는 음성질환의 진단에 도움을 줄 뿐 아니라 음성 치료 및 수술적 치료를 결정하는데 중요한 역할을 한다. 그러나 여러 주기의 영상을 모은 것으로 실제 이미지가 아니며 주기성이 없는 경우 혹은 폐 질환으로 3-5초의 지속적인 발성이 안되면 검사 자체가 불가능하다.Laryngeal stroboscopy not only helps diagnose voice disorders, but also plays an important role in determining voice and surgical treatment. However, it is impossible to test itself if it is not a real image and there is no periodicity or if there is no continuous speech for 3-5 seconds due to lung disease.
이와 같이, 후두 스트로보스코피는 주기성이 없는 환자의 경우 사용상의 제한이 있으며, 녹화할 수 있는 샘플링 속도의 제한으로 초고속 후두내시경 소견과 같은 성대의 모든 주기를 보여 주지 못한다는 단점이 있지만, 일반적인 후두내시경 검사로는 관찰할 수 없는 성대의 많은 특징들을 관찰할 수 있고 초고속 후두내시경 보다 화질이 좋다. 뿐만 아니라 사용상의 용이성, 비용 효과 그리고 동기화된 음성 피드백을 얻을 수 있는 장점 등으로 현재까지 임상에서 가장 많이 사용되고 있다. As such, laryngeal stroboscopy has limitations in the use of patients without periodicity, and the limitation of sampling rate that can be recorded does not show all cycles of the vocal cords, such as ultrafast laryngoscope findings. Many features of the vocal cords, which cannot be observed by examination, can be observed and are of better image quality than ultrafast laryngoscopy. In addition, ease of use, cost effectiveness, and the advantage of obtaining synchronized voice feedback have been widely used in clinical practice to date.
그러나, HSV는초당 2,000 프레임 이상의 높은 프레임률로 녹화가 가능하고 컬러 이미지는 후두의 염증, 후두 백반증 평가와 같이 형태학적 진단에 유용한 가장 이상적인 검사법이지만, 녹화 가능한 시간이 수초 정도로 짧고, 파일 사이즈가 매우 크기 때문에, 녹화 후 재생까지 30분 이상 소요되며재생된 영상의 평가도 쉽지 않다. 또한, 성대 움직임의 유형과 불규칙 정도를 평가할 수 있는 정량적 변수들도 부족하다.However, HSV is capable of recording at high frame rates of more than 2,000 frames per second and color images are the ideal test for morphological diagnosis such as laryngeal inflammation and laryngeal vitiligo evaluation, but recordable time is a few seconds and file size is very large. Because of its size, it takes more than 30 minutes to play after recording, and evaluation of the played video is not easy. There is also a lack of quantitative variables to assess the type and degree of irregularity of vocal cord movement.
이런 단점을 극복하기 위해, 녹화된 영상을 이용하여 후차적으로 기능적 이미지로 변환하는 방법들이 소개되었다. 여기에는 성문 폭 파형, 성문 영역 파형, 포노바이브로그라피(phonovibrography), 러링고그라피, 그리고 디지털 카이모그라피(digital kymography (DKG))등이 있다. 이러한 기술들 사이에서도, DKG 분석이 HSV 데이터의 시간적 특성을 평가할 수 있는 최고의 방법으로 널리 사용되고 있다.그러나 기기 값이 고가이며, 큰 데이터 파일, 후두스트로보스코피 영상에 비해 저해상도 등 여러가지 단점들 때문에 실제 임상에서는 제한적으로 사용되고 있다.To overcome this drawback, methods of converting the recorded image into functional images are introduced. These include glottal width waveforms, glottal domain waveforms, phonovibrography, rulingogography, and digital kymography (DKG). Amongst these techniques, DKG analysis is widely used as the best way to assess the temporal characteristics of HSV data, but because of the high cost of the instrument and its low resolution compared to large data files and laryngeal stroboscopy images, actual clinical trials Limited use in.
[선행기술문헌][Preceding technical literature]
[특허문헌][Patent Documents]
(특허문헌 1) 한국공개특허 제2003-0046787호(Patent Document 1) Korean Patent Publication No. 2003-0046787
[비특허문헌][Non-Patent Documents]
(비특허문헌 1)Svec J, Schutte H. Videokymography: high-speed line scanning of vocal fold vibration. J Voice. 1996;10:201-205.(Non-Patent Document 1) Svec J, Schutte H. Videokymography: high-speed line scanning of vocal fold vibration. J Voice. 1996; 10: 201-205.
(비특허문헌 2)Hirose H. High-speed digital imaging of vocal fold vibration.ActaOtolaryngol Suppl. 1988;458:151-153.(Non-Patent Document 2) Hirose H. High-speed digital imaging of vocal fold vibration. Acta Otolaryngol Suppl. 1988; 458: 151-153.
본 발명의 목적은 고속 카메라의 외부 트리거 기능을 이용하여 성대의 빠른 움직임을 관찰하고, 성대 진동의 한 주기에 대한 정보를 획득하며, 동시에 후두 스트로보스코피 및 평면 스캔 디지털 카이모그래피의 영상을 모두 실시간으로 구현하여 성대의 형태학적인 평가와 기능적인 평가를 가능하게 하는 영상 생성 시스템을 제공하는데 있다.An object of the present invention is to observe the rapid movement of the vocal cords using the external trigger function of the high speed camera, to obtain information about one cycle of the vocal cords, and at the same time both the images of laryngeal stroboscopy and planar scan digital chimography in real time. The present invention provides an image generation system that enables morphological and functional evaluation of vocal cords.
본 발명의 목적인 초당 600~1550 프레임의 고속 후두내시경 카메라 및 외부 트리거 기능을 이용하여 거의 실시간에 가깝게 관찰, 촬영, 저장, 및 재생이 가능하고, 여러 주기의 영상으로부터 한 주기를 피검자의 발성에 대한 기본 주파수와 거의 동일하게 구성하는 영상 생성 시스템을 제공하는데 있다.By using a high-speed laryngoscope camera and an external trigger function of 600-1550 frames per second, which is an object of the present invention, it is possible to observe, photograph, store, and reproduce in near real time, and one cycle from multiple cycles of images An object of the present invention is to provide an image generating system configured to be substantially equal to the fundamental frequency.
상기 목적을 달성하기 위한 본 발명의 제1 측면은, 실시간 후두 스프로보스코피, 고속 후두경 검사, 및 평면 스캔 디지털 카이모그래피를 위한 영상 생성 시스템에 있어서, 성대를 비추기 위한 연속 광원을 발광시키는 광원장치; 외부 트리거의 기능을 구비하고, 상기 성대를 촬영하는 카메라; 및 상기 외부 트리거의 동작 여부에 따라 상기 카메라로부터 촬영된 영상을 기초로 후두 스트로보스코피 영상 또는 평면 스캔 디지털 카이모그래피 영상을 생성하는 영상 관찰 서버를 포함한다.In order to achieve the above object, a first aspect of the present invention provides an image generating system for real-time laryngeal sproboscopy, high-speed laryngoscope, and planar scan digital chymography, comprising: a light source device for emitting a continuous light source for illuminating the vocal cords; A camera having a function of an external trigger and photographing the vocal cords; And an image observation server configured to generate a laryngeal stroboscopic image or a planar scan digital chymograph image based on the image photographed from the camera according to whether the external trigger operates.
바람직하게, 상기 광원장치는, 제논 광원에 해당하는 연속 광원을 발광시킬 수 있다.Preferably, the light source device can emit light of a continuous light source corresponding to the xenon light source.
바람직하게, 상기 카메라는, 초당 600프레임의 영상을 획득하는 고속 카메라에 해당할 수 있다.Preferably, the camera may correspond to a high speed camera that acquires an image of 600 frames per second.
바람직하게, 상기 영상 관찰 서버는, 상기 카메라의 외부 트리거의 기능이 동작하는 경우, 상기 성대에 대한 후두 스트로보스코피 영상을 생성하는 후두 스트로보스코피 영상 생성부; 및 상기 카메라의 외부 트리거의 기능이 동작하지 않는 경우, 상기 성대에 대한 평면 스캔 디지털 카이모그래피 영상을 생성하는 평면 스캔 디지털 카이모그래피 영상 생성부를 포함할 수 있다. Preferably, the image observation server, laryngeal stroboscopic image generation unit for generating a laryngeal stroboscopic image for the vocal cords when the function of the external trigger of the camera operates; And when the function of the external trigger of the camera does not operate, it may include a planar scan digital chymography image generating unit for generating a planar scan digital chymography image for the vocal cords.
바람직하게, 상기 후두 스트로보스코피 영상 생성부는 피검자의 음성신호를 수신하는 음성신호 수신모듈; 상기 음성신호의 기본 주파수를 기초로 트리거 주파수를 설정하는 트리거 주파수 설정 모듈; 상기 트리거 주파수에 따라 트리거 신호를 상기 카메라에 제공하는 트리거 신호 제공 모듈; 상기 트리거 신호에 따라 상기 카메라에 의하여 촬영된 영상을 수신하는 영상 수신모듈; 및 상기 수신된 영상을 조합하여 상기 후두 스트로보스코피 영상을 생성하는 영상 생성 모듈을 포함할 수 있다.Preferably, the laryngeal stroboscopic image generating unit includes a voice signal receiving module for receiving a voice signal of a subject; A trigger frequency setting module for setting a trigger frequency based on a fundamental frequency of the voice signal; A trigger signal providing module for providing a trigger signal to the camera according to the trigger frequency; An image receiving module which receives an image photographed by the camera according to the trigger signal; And an image generation module for generating the laryngeal stroboscopic image by combining the received images.
바람직하게, 상기 음성 신호 수신 모듈은, 상기 피검자의 윤상 연골 아래의 경부 중앙에 부착된 음성 검출기 또는 마이크로부터 상기 음성 신호를 수신할 수 있다.Preferably, the voice signal receiving module may receive the voice signal from a voice detector or a microphone attached to the center of the neck under the annular cartilage of the subject.
바람직하게, 상기 트리거주파수 설정 모듈은, 상기 기본 주파수에 특정 주파수를 가감한 값을 상기 트리거 주파수로 설정하되, 상기 특정 주파수는 1Hz 내지0.5Hz에 해당할 수 있다.Preferably, the trigger frequency setting module sets a value obtained by adding or subtracting a specific frequency to the basic frequency as the trigger frequency, and the specific frequency may correspond to 1 Hz to 0.5 Hz.
바람직하게, 상기 영상 수신 모듈은, 상기 트리거 신호에 따라 상기 카메라에 의하여 촬영된, 상기 성대의 움직임에 따른 연속적인 주기의 영상에서 특정 부분에 해당하는 한 프레임의 정지 영상을 수신하고, 상기 수신된 정지 영상을 순차적으로 저장하되, 상기 정지 영상은 상기 연속적인 주기의 영상에서 특정 주파수 이내로 샘플링 될 수 있다.Preferably, the image receiving module receives a still image of one frame corresponding to a specific part in an image of a continuous period according to the movement of the vocal cords, which is captured by the camera according to the trigger signal, and receives the received image. Still images may be sequentially stored, but the still images may be sampled within a specific frequency in the image of the continuous period.
바람직하게, 상기 영상 생성 모듈은, 상기 저장된 정지 영상들을 조합하여 상기 성대의 움직임에 대한 한 주기의 가상 영상을 생성할 수 있다.Preferably, the image generating module may generate the virtual image of one cycle of the movement of the vocal cords by combining the stored still images.
바람직하게, 상기 평면 스캔 디지털 카이모그래피 영상 생성부는, 상기 카메라에 의하여 촬영된 영상을 수신하는 영상 수신 모듈; 상기 영상으로부터 대상 영역 및 단위 화소를 설정하고, 상기 대상 영역 및 단위 화소에 따라 각 프레임의 화소 정보를 추출하는 화소 정보 추출 모듈; 상기 추출된 각 프레임의 화소 정보를 조합하여 상기 평면 스캔 디지털 카이모그래피 영상을 구성할 프레임을 생성하는 프레임 생성 모듈; 및상기 프레임을 조합하여 평면 스캔 디지털 카이모그래피 영상을 생성하는 영상 생성 모듈을 포함할 수 있다.Preferably, the planar scan digital chymography image generating unit comprises: an image receiving module configured to receive an image photographed by the camera; A pixel information extraction module configured to set a target area and a unit pixel from the image, and extract pixel information of each frame according to the target area and the unit pixel; A frame generation module configured to combine the pixel information of each extracted frame to generate a frame for constructing the planar scan digital chymograph image; And an image generation module that generates the planar scan digital chymograph image by combining the frames.
바람직하게, 상기 카메라의 상기 외부 트리거의 동작 여부는 실시간으로 전환될 수 있다.Preferably, whether the external trigger of the camera is operated may be switched in real time.
상기 목적을 달성하기 위한 본 발명의 제2 측면은, 광원장치, 카메라, 및 영상 관찰 서버를 포함하는, 실시간 후두 스프로보스코피, 고속 후두경 검사, 및 평면 스캔 디지털 카이모그래피를 위한 영상 생성 시스템에서 수행되는 영상 생성 방법에 있어서, (a) 상기 카메라에 구비된 외부 트리거의 기능의 동작 여부를 확인하는 단계; 및 (b) 상기 외부 트리거의 동작 여부에 따라 상기 카메라로부터 촬영된 영상을 기초로 후두 스트로보스코피 영상 또는 평면 스캔 디지털 카이모그래피 영상을 생성하는 단계를 포함한다.A second aspect of the present invention for achieving the above object is performed in an image generating system for real-time laryngeal sproboscopy, high-speed laryngoscopy, and planar scan digital chymography, comprising a light source device, a camera, and an image observation server. A method of generating an image comprising: (a) checking whether an external trigger function of the camera is operated; And (b) generating a laryngeal stroboscopic image or a planar scan digital chymograph image based on the image photographed from the camera according to whether the external trigger operates.
바람직하게, 상기 (b) 단계는, (b-1) 상기 카메라의 외부 트리거의 기능이 동작하는 경우, 상기 성대에 대한 후두 스트로보스코피 영상을 생성하는 단계; 및 (b-2) 상기 카메라의 외부 트리거의 기능이 동작하지 않는 경우, 상기 성대에 대한 평면 스캔 디지털 카이모그래피 영상을 생성하는 단계를 포함할 수 있다.Preferably, the step (b) comprises: (b-1) generating a laryngeal stroboscopic image of the vocal cords when the function of the external trigger of the camera is operated; And (b-2) generating a planar scan digital chymograph image of the vocal cords when the function of the external trigger of the camera does not operate.
바람직하게, 상기 (b-1) 단계는, 피검자의 음성신호를 수신하는 단계; 상기 음성신호의 기본 주파수를 기초로 트리거 주파수를 설정하는 단계; 상기 트리거 주파수에 따라 트리거 신호를 상기 카메라에 제공하는 단계; 상기 트리거 신호에 따라 상기 카메라에 의하여 촬영된 영상을 수신하는 단계; 및 상기 수신된 영상을 조합하여 상기 후두 스트로보스코피 영상을 생성하는 단계를 포함할 수 있다.Preferably, step (b-1) comprises: receiving a voice signal of a subject; Setting a trigger frequency based on a fundamental frequency of the voice signal; Providing a trigger signal to the camera according to the trigger frequency; Receiving an image photographed by the camera according to the trigger signal; And combining the received images to generate the laryngeal stroboscopy image.
바람직하게, 상기 (b-2) 단계는, 상기 카메라에 의하여 촬영된 영상을 수신하는 단계; 상기 영상으로부터 대상 영역 및 단위 화소를 설정하고, 상기 대상 영역 및 단위 화소에 따라 각 프레임의 화소 정보를 추출하는 단계; 상기 추출된 각 프레임의 화소 정보를 조합하여 상기 평면 스캔 디지털 카이모그래피 영상을 구성할 프레임을 생성하는 단계; 및 상기 프레임을 조합하여 평면 스캔 디지털 카이모그래피 영상을 생성하는 단계를 포함할 수 있다.Preferably, step (b-2) comprises: receiving an image photographed by the camera; Setting a target region and a unit pixel from the image, and extracting pixel information of each frame according to the target region and unit pixel; Generating a frame to compose the planar scan digital chymograph image by combining pixel information of each extracted frame; And combining the frames to generate a planar scan digital chymograph image.
상기한 바와 같이 본 발명에 의하면, 후두 스트로보스코피, 고속 후두내시경 검사, 및 평면 스캔 디지털 카이모그래피를 통합한 시스템으로서, 후두 스트로보스코피 및 고속 후두내시경 검사뿐만 아니라 기능적인 이미지 양식인 평면 스캔 디지털 카이모그래피의 장점을 결합한 것으로서,고속후두내시경 검사 기능 이용하여 음성과 영상을 동시에 녹화 가능하도록 피드백 하면서 평면 스캔 디지털 카이모그래피를 획득할 수 있고, 후두 스트로보스코피 기능을 이용하여 실시간 고속 후두 내시경 검사에 준하는 후두 스크로보스코피 영상의 녹화가 가능하기 때문에, 짧은 시간만으로도 임상가에게 유용하고 구체적인 정보를 제공하는 효과가 있다.As described above, according to the present invention, a system incorporating laryngeal stroboscopy, high-speed laryngoscopy, and planar-scan digital chymography, as well as laryngeal stroboscopy and high-speed laryngoscopy, is a functional image form of planar-scan digital chemography It combines the advantages of laryngeal scaffolding, which can acquire planar scan digital chymography while feeding back voice and video using the high-speed laryngoscope function, and the laryngeal stroboscopy function. Since the recording of the roboscopic image is possible, it is effective to provide the clinician with useful and specific information in a short time.
또한, 실시간 고속 후두내시경 검사와 평면 스캔 디지털 카이모그래피를 이용하면 짧은 발성 시간만으로도 임상가에게 구체적인 정보를 제공하는 효과가 있다. In addition, the use of real-time high-speed laryngoscopy and planar scan digital chymography has the effect of providing specific information to the clinician with a short talk time.
또한, 후두 스트로보스코피, 고속 후두내시경 검사, 및 평면 스캔 디지털 카이모그래피의 영상을 이용한 다중 기능 검사를 시행함으로써, 각각 검사하는 것 보다 시간적인 측면에서 절약되고, 동시에 환자의 성대 진동 상태 평가가 가능하기 때문에 각각 검사하는 것에 비해서 성대 질환 진단의 정확성을 높일 수 있는 효과가 있다. In addition, multiple function tests using images of laryngeal stroboscopy, high-speed laryngoscopes, and planar-scan digital chymography can save time in terms of time, and at the same time evaluate the patient's vocal cord vibration. Therefore, compared with each test, it is possible to increase the accuracy of the diagnosis of vocal cord disease.
도 1은 본 발명의 바람직한 실시예에 따른 영상 생성 시스템의 구성도이다.1 is a block diagram of an image generation system according to a preferred embodiment of the present invention.
도 2는 도 1의 영상 관찰 서버에 대한 블록도이다.FIG. 2 is a block diagram of the image observing server of FIG. 1.
도 3은 도 1의 영상 생성 시스템에서 수행되는 후두 스트로보스코피 영상의 영상 생성 방법에 대한 흐름도이다.3 is a flowchart illustrating an image generating method of laryngeal stroboscopic image performed in the image generating system of FIG. 1.
도 4는 도 1의 영상 생성 시스템에서 수행되는 평면 스캔 디지털 카이모그래피 영상의 영상 생성 방법에 대한 흐름도이다.FIG. 4 is a flowchart illustrating an image generating method of a planar scan digital chymography image performed in the image generating system of FIG. 1.
도 5는 트리거 신호에 따라 카메라에 의하여 촬영되는 정지 영상을 설명하기 위한 예시도이다.5 is an exemplary diagram for describing a still image captured by a camera according to a trigger signal.
도 6은 고속 후두내시경 영상 및 다중 프레임 후두 스트로보스코피 영상을 나타내는 예시도이다.6 is an exemplary diagram illustrating a fast laryngeal endoscope image and a multi-frame laryngeal stroboscopy image.
도 7은 고속 후두내시경 영상과 본 발명에 의하여 생성된 후두 스트로보스코피 영상을 나타내는 다른 예시도이다.7 is another exemplary diagram illustrating a fast laryngeal endoscope image and a laryngeal stroboscopic image generated by the present invention.
이하, 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다. "및/또는"은 언급된 아이템들의 각각 및 하나 이상의 모든 조합을 포함한다.Advantages and features of the present invention, and a method of achieving them will be apparent from the following detailed description with reference to the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below, but will be implemented in various forms, and only the present embodiments are intended to complete the disclosure of the present invention, and the general knowledge in the art to which the present invention pertains. It is provided to fully convey the scope of the invention to those skilled in the art, and the present invention is defined only by the scope of the claims. Like reference numerals refer to like elements throughout. “And / or” includes each and all combinations of one or more of the items mentioned.
비록 제1, 제2 등이 다양한 소자, 구성요소 및/또는 섹션들을 서술하기 위해서 사용되나, 이들 소자, 구성요소 및/또는 섹션들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 소자, 구성요소 또는 섹션들을 다른 소자, 구성요소 또는 섹션들과 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 소자, 제1 구성요소 또는 제1 섹션은 본 발명의 기술적 사상 내에서 제2 소자, 제2 구성요소 또는 제2 섹션일 수도 있음은 물론이다.Although the first, second, etc. are used to describe various elements, components and / or sections, these elements, components and / or sections are of course not limited by these terms. These terms are only used to distinguish one element, component or section from another element, component or section. Therefore, the first device, the first component, or the first section mentioned below may be a second device, a second component, or a second section within the technical spirit of the present invention.
또한, 각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.In addition, in each step, an identification code (eg, a, b, c, etc.) is used for convenience of description, and the identification code does not describe the order of the steps, and each step is clearly specified in context. Unless stated in order, it may occur differently from the stated order. That is, each step may occur in the same order as specified, may be performed substantially simultaneously, or may be performed in the reverse order.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 “포함한다(comprises)”및/또는 “포함하는(comprising)”은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.The terminology used herein is for the purpose of describing particular embodiments only and is not intended to be limiting of the invention. In this specification, the singular also includes the plural unless specifically stated otherwise in the phrase. As used herein, “comprises” and / or “comprising” refers to the presence of one or more other components, steps, operations and / or elements. Or does not exclude additions.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.Unless otherwise defined, all terms (including technical and scientific terms) used in the present specification may be used in a sense that can be commonly understood by those skilled in the art. In addition, the terms defined in the commonly used dictionaries are not ideally or excessively interpreted unless they are specifically defined clearly.
또한, 본 발명의 실시예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명의 실시예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.In describing the embodiments of the present invention, when it is determined that a detailed description of a known function or configuration may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted. In addition, terms to be described below are terms defined in consideration of functions in the embodiments of the present invention, which may vary according to intentions or customs of users and operators. Therefore, the definition should be made based on the contents throughout the specification.
도 1은 본 발명의 바람직한 실시예에 따른 영상 생성 시스템의 구성도이다.1 is a block diagram of an image generation system according to a preferred embodiment of the present invention.
도 1을 참조하면, 영상 생성 시스템(100)은 광원장치(110), 후두경(120), 카메라(130), 및 영상 관찰 서버(150)를 포함한다. Referring to FIG. 1, the image generating system 100 includes a light source device 110, a laryngoscope 120, a camera 130, and an image observing server 150.
광원장치(110)는 성대를 비추는 장치이고, 후두경(120)은 성대를 관찰할 수 있는 기구로서, 광원장치(110)와 후두경(120)에 의하여 성대의 영상이 관찰된다. 바람직하게, 광원장치(110)는 성대를 비추기 위한 연속 광원을 발광시킬 수 있고, 예를 들어, 제논(Xenon) 광원에 해당하는 연속 광원을 발광시킬 수 있다. 또한, 후두경(120)은 이하에서 설명할 카메라(130)와 일체형으로 구현될 수 있다.The light source device 110 is a device for illuminating the vocal cords, and the laryngoscope 120 is a mechanism for observing the vocal cords, and an image of the vocal cords is observed by the light source device 110 and the laryngoscope 120. Preferably, the light source device 110 may emit a continuous light source for illuminating the vocal cords, for example, may emit a continuous light source corresponding to a Xenon light source. In addition, the laryngoscope 120 may be implemented integrally with the camera 130 to be described below.
카메라(130)는 광원장치(110) 및 후두경(120)과 연결되어 성대 및 성문을 포함한 후두의 영상을 촬영, 녹화 및 저장하는 장치이다. 바람직하게, 카메라(130)는 초당 600프레임(frame)의 영상을 획득하는 고속 카메라에 해당할 수 있고, 예를 들어, 고속 CCD 카메라 또는 글로벌 셔터(global shutter) 방식의 CMOS 카메라일 수 있다. 또한, 카메라(130)는 외부 트리거의 기능을 구비할 수 있고, 여기에서, 외부 트리거 기능은 영상을 획득하는 순간을 직접 결정하기 위한 것이다. 예를 들어, 외부 트리거 기능이 없는 카메라의 경우, 초당 30프레임의 정지 영상을 획득할 때, 1/30초의 동일한 간격으로 영상을 획득하나, 외부 트리거 기능이 있는 카메라를 이용하면 1/30초가 아닌 서로 다른 시간 간격으로 정지 영상을 획득할 수 있다. 바람직하게, 외부 트리거 기능은 하드웨어 방식과 소프트웨어 방식으로 구현될 수 있고, 하드웨어 방식의 경우, 트리거 장치(140)가 카메라(130)에 연결되고, 트리거 장치(140)에서 카메라(130)가 정지 영상을 획득하는 시점을 결정할 수 있다. 외부 트리거 기능이 소프트웨어 방식으로 구현될 경우, 카메라(130)를 제어하는 프로그램에 의하여 정지 영상을 획득하는 시점이 결정될 수 있고, 예를 들어, 영상 관찰 서버(150)에 있는 카메라(130)를 제어하는 프로그램에 의하여 정지 영상을 획득하는 시점이 결정될 수 있다.The camera 130 is connected to the light source device 110 and the laryngoscope 120 to photograph, record, and store images of the larynx including the vocal cords and the gates. Preferably, the camera 130 may correspond to a high speed camera that acquires an image of 600 frames per second, and may be, for example, a high speed CCD camera or a global shutter type CMOS camera. In addition, the camera 130 may have a function of an external trigger, wherein the external trigger function is for directly determining the moment of acquiring the image. For example, a camera without an external trigger function acquires images at the same interval of 1/30 seconds when acquiring a still image of 30 frames per second, but not 1/30 seconds using a camera with an external trigger function. Still images may be acquired at different time intervals. Preferably, the external trigger function may be implemented in a hardware method and a software method. In the hardware method, the trigger device 140 is connected to the camera 130, and the camera device 130 is a still image in the trigger device 140. It is possible to determine when to obtain. When the external trigger function is implemented in a software manner, a time point for acquiring a still image may be determined by a program controlling the camera 130. For example, the external trigger function may control the camera 130 in the image observation server 150. A time point for acquiring a still image may be determined by a program.
영상 관찰 서버(150)는 카메라(130)로부터 촬영된 영상을 제공받아 실시간 후두 스트로보스코피, 고속 후두경 검사, 및 평면 스캔 디지털 카이모그래피를 위한 영상을 생성하는 장치이다. 바람직하게, 영상 관찰 서버(150)는 카메라(130)의 외부 트리거의 동작 여부에 따라 카메라(130)로부터 촬영된 영상을 기초로 후두 스트로보스코피 영상 또는 평면 스캔 디지털 카이모그래피 영상을 생성할 수 있다. 또한, 영상 관찰 서버(150)는 디스플레이 장치와 연결되어 생성한 영상, 즉, 고속 후두내시경 영상(161), 다중 프레임 후두 스트로보스코피 영상(162), 평면 스캔 디지털 카이모그래피 영상(163), 및 고속 후두내시경 영상 및 평면 스캔 디지털 카이모그래피 영상이 결합된 영상(164)을 출력할 수 있고, 영상 관찰 서버(150)의 내부 저장 장치 또는 영상 관찰 서버(150)와 연결된 외부 저장 장치에 해당 영상들을 저장하고 관리할 수 있다. The image observation server 150 is an apparatus for receiving images captured by the camera 130 and generating images for real-time laryngeal stroboscopy, high-speed laryngoscope, and planar scan digital chymography. Preferably, the image observing server 150 may generate a laryngeal stroboscopic image or a planar scan digital chymograph image based on the image captured by the camera 130 according to whether the external trigger of the camera 130 operates. In addition, the image observation server 150 is an image generated in connection with the display device, that is, a high-speed laryngeal endoscope image 161, a multi-frame laryngeal stroboscopy image 162, a planar scan digital chimography image 163, and a high speed The image 164 combined with the laryngoscope image and the planar scan digital chymograph image may be output, and the images may be stored in an internal storage device of the image observation server 150 or an external storage device connected to the image observation server 150. And manage.
도 2는 도 1의 영상 관찰 서버에 대한 블록도이다.FIG. 2 is a block diagram of the image observing server of FIG. 1.
도 2를 참조하면, 영상 관찰 서버(150)는 후두 스트로보스코피 영상 생성부(210), 평면 스캔 디지털 카이모그래피 영상 생성부(220), 및 제어부(230)를 포함하고, 제어부(230)는 후두 스트로보스코피 영상 생성부(210), 및 평면 스캔 디지털 카이모그래피 영상 생성부(220)의 동작 및 데이터의 흐름을 제어한다.Referring to FIG. 2, the image observing server 150 includes a laryngeal stroboscopic image generator 210, a planar scan digital chymography image generator 220, and a controller 230, and the controller 230 is a laryngeal larynx. The operation of the stroboscope image generator 210 and the planar scan digital chymograph image generator 220 controls the flow of data.
바람직하게, 영상 관찰 서버(150)는 고속 후두내시경 영상을 기본적으로 생성할 수 있고, 고속 후두내시경 영상을 생성하는 방법은 종래의 기술에 의하므로, 본 발명에서는 상세하게 설명하지 않는다.Preferably, the image observation server 150 may basically generate a high-speed laryngoscopy image, and the method for generating a high-speed laryngoscope image is based on conventional techniques, and thus, the present invention will not be described in detail.
바람직하게, 후두 스트로보스코피 영상 생성부(210)는 카메라(130)의 외부 트리거의 기능이 동작하는 경우, 성대에 대한 후두 스트로보스코피 영상을 생성하고, 음성 신호 수신 모듈(211), 트리거 주파수 설정 모듈(212), 트리거 신호 제공 모듈(213), 영상 수신 모듈(214), 및 영상 생성 모듈(215)를 포함한다. Preferably, the laryngeal stroboscopic image generation unit 210 generates a laryngeal stroboscopic image of the vocal cords when the external trigger function of the camera 130 operates, and receives a voice signal receiving module 211 and a trigger frequency setting module. 212, a trigger signal providing module 213, an image receiving module 214, and an image generating module 215.
또한, 평면 스캔 디지털 카이모그래피 영상 생성부(220)는 카메라(130)의 외부 트리거의 기능이 동작하지 않는 경우, 성대에 대한 평면 스캔 디지털 카이모그래피 영상을 생성하고, 영상 수신 모듈(221), 화소 정보 추출 모듈(222), 프레임 생성 모듈(223), 및 영상 생성 모듈(224)을 포함한다.In addition, when the function of the external trigger of the camera 130 does not operate, the planar scan digital chymography image generator 220 generates a plane scan digital chymography image for the vocal cords, and receives the image receiving module 221 and the pixel. An information extraction module 222, a frame generation module 223, and an image generation module 224.
이하에서는, 도 3을 참조하여, 영상 관찰 서버(150)의 후두 스트로보스코피 영상 생성부(210)를 통하여 수행되는 후두 스트로보스코피 영상의 영상 생성 방법을 설명한다.Hereinafter, a method of generating an image of a laryngeal stroboscopic image performed by the laryngeal stroboscopic image generator 210 of the image observation server 150 will be described with reference to FIG. 3.
먼저, 카메라(130)의 외부 트리거의 기능을 동작시킨다(단계 S310). 바람직하게, 외부 트리거의 기능의 동작 여부는 사용자에 의하여 설정될 수 있다.First, the function of the external trigger of the camera 130 is operated (step S310). Preferably, whether to operate the function of the external trigger may be set by the user.
음성 및 진동 신호 수신 모듈(211)은 피검자의 음성 및 진동 신호를 수신한다(단계 S320). 바람직하게, 피검자는 윤상 연골 아래의 경부 중앙에 진동검출기를 부착하거나 또는 영상 관찰 서버(150)와 연결된 마이크가 구비될 수 있고, 음성 신호 수신 모듈(211)은 피검자의 발성시 진동 검출기 또는 마이크에 입력된 피검자의 음성 신호를 수신할 수 있다. The voice and vibration signal receiving module 211 receives a voice and vibration signal of the examinee (step S320). Preferably, the subject may be provided with a vibration detector in the center of the neck under the cartilaginous cartilage or may be provided with a microphone connected to the image observation server 150, and the voice signal receiving module 211 may be connected to the vibration detector or microphone when the subject speaks. The voice signal of the input subject may be received.
트리거 주파수 설정 모듈(212)은 음성 신호의 기본 주파수를 기초로 트리거 주파수를 설정한다(단계 S330).바람직하게, 트리거 주파수 설정 모듈(212)은 기본 주파수에 특정 주파수를 더한 값을 트리거 주파수로 설정할 수 있고, 여기에서, 특정 주파수는 0.5Hz~1Hz에 해당할 수 있다.예를 들어, 피검자가 발성하는 동안의 영상이 1초간 촬영되면, 피검자가 발성한 주파수, 즉 기본 주파수와 동일한 수의 정지 영상이 획득될 수 있고, 기본 주파수에 가산한 1Hz에 의하여 1초 동안 1주기의 성대 움직임을 담은 후두 스트로보스코피영상이 생성될 수 있으므로, 트리거 주파수 설정 모듈(212)은 기본 주파수에 특정 주파수를 더한 값을 트리거 주파수로 설정하는 것이다.The trigger frequency setting module 212 sets the trigger frequency based on the fundamental frequency of the voice signal (step S330). Preferably, the trigger frequency setting module 212 sets a threshold frequency plus a specific frequency as the trigger frequency. In this case, the specific frequency may correspond to 0.5 Hz to 1 Hz. For example, if an image is captured for one second during the speech of the subject, the frequency of the subject's speech, that is, the same number of stops as the fundamental frequency, may be used. Since an image may be acquired and a laryngeal stroboscopic image containing one cycle of vocal cord movement for one second may be generated by 1 Hz added to the fundamental frequency, the trigger frequency setting module 212 may add a specific frequency to the fundamental frequency. Is to set the value to the trigger frequency.
트리거 신호 제공 모듈(213)은 트리거 주파수에 따라 트리거 신호를 카메라(130)에 제공한다(단계 S340). 즉, 트리거 신호 제공 모듈(213)은 카메라(130)가 트리거 주파수에 따른 정지 영상을 촬영할 수 있도록, 정지 영상이 촬영될 시점에 트리거 신호를 카메라(130)에 제공한다. 바람직하게, 카메라(130)의 셔터스피드(shutter speed)는 1/1,000초 또는 1/2,000초 지속시간(duration)으로 조정될 수 있다.The trigger signal providing module 213 provides a trigger signal to the camera 130 according to the trigger frequency (step S340). That is, the trigger signal providing module 213 provides a trigger signal to the camera 130 when the still image is captured so that the camera 130 can capture a still image according to the trigger frequency. Preferably, the shutter speed of the camera 130 may be adjusted to a 1 / 1,000 second or 1 / 2,000 second duration.
영상 수신 모듈(214)은 트리거 신호에 따라 카메라에 의하여 촬영된 영상을 수신한다(단계 S350). 바람직하게, 영상 수신 모듈(214)은 트리거 신호에 따라 카메라(130)에 의하여 촬영된, 성대의 움직임에 따른 연속적인 주기의 영상에서 특정 부분에 해당하는 한 프레임의 정지 영상을 수신하고, 여기에서, 정지 영상은 연속적인 주기의 영상에서 특정 주파수 이내로 샘플링 될 수 있다. 또한, 수신된 정지 영상은 순차적으로 저장될 수 있다. 예를 들어, 카메라(130)에 의하여 촬영된 영상은 USB 3.0 고속 디지털 카메라(high-speed digital camera)가 연결된 PC, 또는 의료영상 저장 전송 장치(MediView SDHD, U-medical, Korea)에 저장될 수 있다.The image receiving module 214 receives an image captured by the camera according to the trigger signal (step S350). Preferably, the image receiving module 214 receives a still image of one frame corresponding to a specific portion in the image of the continuous period according to the movement of the vocal cords, which is captured by the camera 130 according to the trigger signal, and here However, still images can be sampled within a certain frequency in a series of images. In addition, the received still images may be sequentially stored. For example, the image captured by the camera 130 may be stored in a PC connected to a USB 3.0 high-speed digital camera or a medical image storage transmission device (MediView SDHD, U-medical, Korea). have.
영상 생성 모듈(215)은 영상 수신 모듈(214)에 의하여 수신된 영상을 조합하여 후두 스트로보스코피 영상을 생성한다(S360). 바람직하게, 영상 생성 모듈(215)은 저장된 정지 영상들을 조합하여 성대의 움직임에 대한 한 주기의 가상 영상에 해당하는 후두 스트로보스코피 영상을 생성할 수 있다. 또한, 영상 생성 모듈(215)은 생성한 후두 스트로보스코피 영상을 내부 저장 장치 또는 외부 저장 장치에 저장하거나 또는 영상 관찰 서버(150)에 연결된 디스플레이 장치로 출력할 수 있다.The image generating module 215 combines the images received by the image receiving module 214 to generate a laryngeal stroboscopic image (S360). Preferably, the image generation module 215 may combine the stored still images to generate a laryngeal stroboscopic image corresponding to a virtual image of one cycle of the movement of the vocal cords. In addition, the image generation module 215 may store the generated laryngeal stroboscopic image in an internal storage device or an external storage device, or output it to a display device connected to the image observation server 150.
예를 들어, 도 5를 참조하면, 피검자의 발성에 따른 성대의 연속적이고 주기적인 움직임이 도 5에 도시된 사인파와 같은 경우, 카메라(130)는 트리거 신호 제공 모듈(213)에 의하여 제공된 트리거 신호에 따라, 성대의 연속적이고 주기적인 움직임에서 특정 부분(511 내지 513)에 해당하는 한 프레임의 정지 영상을 촬영할 수 있다. 영상 수신 모듈(214)은 이와 같이 카메라(130)에 의하여 촬영된 511 내지 513에 해당하는 각 프레임의 정지 영상들을 수신하여 순차적으로 저장하고, 영상 생성 모듈(215)은 저장된 511 내지 513에 해당하는 각 프레임의 정지 영상들을 조합하여, 한 주기의 영상(520)을 생성할 수 있다.For example, referring to FIG. 5, when the continuous and periodic movement of the vocal cords according to the voice of a subject is the same as the sine wave shown in FIG. 5, the camera 130 may provide a trigger signal provided by the trigger signal providing module 213. As a result, a still image of one frame corresponding to the specific portions 511 to 513 may be captured in continuous and periodic movement of the vocal cords. The image receiving module 214 sequentially receives and stores still images of each frame corresponding to 511 to 513 photographed by the camera 130, and the image generating module 215 corresponds to the stored 511 to 513. One cycle of the image 520 may be generated by combining the still images of each frame.
즉, 본 발명에 따른 영상 관찰 서버(150)의 후두 스트로보스코피 영상 생성부(210)는, 단계 S320 내지 S360을 통하여, 피검자 성대의 발성 주파수에 해당하는 기본 주파수를 기초로 트리거 주파수를 설정하고, 트리거 주파수에 따라 외부 트리거를 이용하여 카메라(130)의 영상 샘플링 속도를 조절함으로써, 성대 진동의 한 주기당 영상 개수를 기본 주파수에 거의 근접하게 구성하여 초당 2,000프레임 이상의 고속 카메라로 촬영한 고속 비디오 영상과 같은 효과를 나타내는 후두 스트로보수코피 영상을 생성할 수 있다. That is, the laryngeal stroboscopic image generation unit 210 of the image observation server 150 according to the present invention sets the trigger frequency based on the fundamental frequency corresponding to the speech frequency of the subject's vocal cords through steps S320 to S360, By adjusting the image sampling rate of the camera 130 using an external trigger according to the trigger frequency, a high-speed video image captured by a high-speed camera of 2,000 frames or more per second by configuring the number of images per cycle of the vocal cord vibration close to the fundamental frequency A laryngeal straw conservative nosebleed image can be generated that exhibits the same effect.
예를 들어, 피검사자가 150Hz의 기본주파수로 발성하는 경우, 피검자의 성대는 1초에 150번이 움직이는 것이고, 트리거 주파수를 기본 주파수에서 1Hz 지연한151Hz로 설정하여, 1초동안 피검자의 성대의 움직임을 외부 트리거 기능을 이용하여 획득하면, 75장의 정지 영상이 획득될 수 있다. 다른 예를 들어,트리거 주파수를 기본 주파수에서 0.5Hz 지연한 150.5Hz로 설정하여, 0.5초 동안 피검자의 성대의 움직임을 외부 트리거 기능을 이용하여 획득하면, 150장의 정지 영상이 획득될 수 있다. 즉, 이와 같은 트리거 주파수의 설정 및 외부 트리거 기능을 이용하여 정지 영상이 획득되면, 기존의 일반 카메라(보통 25~30 FPS)보다 많은 프레임의 획득이 가능하여, 성대의 움직임을 더 많은 프레임 즉, 다중 프레임 후두 스트로보스코피(Multi-frame laryngeal videostroboscopy; MF LVS)를 통해 성대의 움직임이 관찰될 수 있으므로, 더욱 미세한 성대의 움직임 특징을 확인할 수 있게 한다.For example, if the subject utters at a fundamental frequency of 150 Hz, the vocal cords of the subject move 150 times per second, and the trigger frequency is set to 151 Hz with a delay of 1 Hz from the fundamental frequency, thereby moving the vocal cords of the subject for 1 second. By using the external trigger function, 75 still images can be obtained. As another example, when the trigger frequency is set to 150.5 Hz, which is delayed by 0.5 Hz from the fundamental frequency, and the motion of the subject's vocal cords is acquired using an external trigger function for 150 seconds, 150 still images may be obtained. That is, when a still image is acquired using the setting of the trigger frequency and the external trigger function, more frames can be obtained than conventional cameras (usually 25 to 30 FPS), so that the motion of the vocal cords is increased by more frames, that is, Multi-frame laryngeal videostroboscopy (MF LVS) allows the movement of the vocal cords to be observed, allowing for the identification of finer vocal motions.
이하에서는, 도 4를 참조하여, 영상 관찰 서버(150)의 평면 스캔 디지털 카이모그래피 영상 생성부(220)를 통하여 수행되는 평면 스캔 디지털 카이모그래피 영상의 영상 생성 방법을 설명한다.Hereinafter, referring to FIG. 4, a method of generating an image of a planar scan digital chymograph image performed by the planar scan digital chymograph image generator 220 of the image observing server 150 will be described.
먼저, 카메라(130)의 외부 트리거의 기능을 동작시키지 않는다(단계 S410). 바람직하게, 외부 트리거의 기능의 동작 여부는 사용자에 의하여 설정될 수 있다.First, the function of the external trigger of the camera 130 is not operated (step S410). Preferably, whether to operate the function of the external trigger may be set by the user.
영상 수신 모듈(221)은 카메라(130)에 의하여 촬영된 영상을 수신한다(단계 S420). 바람직하게, 영상 수신 모듈(221)은 카메라(130)로부터 실시간으로 촬영되는 후두내시경 아날로그 영상을 고속 후두내시경 디지털 영상 데이터로 변환하여 실시간으로 획득할 수 있다. 또는, 영상 수신 모듈(221)은 영상 관찰 서버(150)의 내부 저장 장치 또는 외부 저장 장치에 기저장된 후두내시경 영상을 로드할 수 있다.The image receiving module 221 receives an image photographed by the camera 130 (step S420). Preferably, the image receiving module 221 may convert the laryngoscope analog image photographed in real time from the camera 130 into high-speed laryngoscope digital image data to obtain in real time. Alternatively, the image receiving module 221 may load a laryngoscope image pre-stored in an internal storage device or an external storage device of the image observation server 150.
화소 정보 추출 모듈(222)은 수신된 영상으로부터 대상 영역 및 단위 화소를 설정하고, 대상 영역 및 단위 화소에 따라 각 프레임의 화소 정보를 추출한다(단계 S430). 여기에서, 대상 영역은 고속 후두내시경 영상에서 어느 부분을 평면 스캔 디지털 카이모그래피 영상으로 생성할 것인지에 대한 영역이고, 단위 화소는 대상 영역의 소정 화소 라인 또는 화소 라인을 구성하는 적어도 하나의 소정 화소에 해당하는 것으로서, 고속 후두내시경 영상의 각 프레임마다 화소 정보를 추출하는 기준이 되는 단위이다. 또한, 화소 정보 추출 모듈(222)은 생성할 평면 스캔 디지털 카이모그래피 영상의 포맷 정보, 예를 들어, 프레임율(frame rate) 등을 설정할 수 있다.The pixel information extraction module 222 sets a target area and a unit pixel from the received image, and extracts pixel information of each frame according to the target area and the unit pixel (step S430). Here, the target area is an area of which part of the high-speed laryngoscopy image is to be generated as a planar scan digital chymography image, and the unit pixel corresponds to at least one predetermined pixel constituting a predetermined pixel line or a pixel line of the target area. In this case, it is a unit serving as a reference for extracting pixel information for each frame of the fast laryngeal endoscope image. In addition, the pixel information extraction module 222 may set format information, for example, a frame rate, of a planar scan digital chymography image to be generated.
바람직하게, 화소 정보 추출 모듈(222)은 고속 후두내시경 영상의 첫번째프레임부터, 설정한 단위 화소 만큼 매 프레임 마다 화소 정보를 추출할 수 있다. 또한, 화소 정보 추출 모듈(222)은 고속 후두내시경 영상의 프레임 중 특정 프레임의 화소 정보를 추출한 후, 화소 정보를 추출한 위치의 다음 위치를, 특정 프레임의 다음 프레임에서 화소 정보를 추출할 화소 정보 추출 위치로 결정할 수 있다. 즉, 화소 정보 추출 위치는 이전 프레임에서 추출한 화소 위치의 다음 위치로 결정되고, 화소 정보 추출 위치의 이동은, 좌에서 우, 우에서 좌, 상에서 하, 및 하에서 상 중 하나로 결정되어 모든 프레임에서 일정한 방향으로 이동된다.Preferably, the pixel information extraction module 222 may extract pixel information every frame by the set unit pixel from the first frame of the high-speed laryngoscope image. In addition, the pixel information extraction module 222 extracts pixel information of a specific frame from among frames of the high-speed laryngeal endoscope image, and extracts pixel information to extract pixel information from the next position of the location from which the pixel information is extracted. Can be determined by location. That is, the pixel information extraction position is determined as the next position of the pixel position extracted in the previous frame, and the movement of the pixel information extraction position is determined as one of the top to bottom, top to bottom, top to bottom, and bottom to be constant in every frame. Is moved in the direction.
프레임 생성 모듈(223)은 추출된 각 프레임의 화소 정보를 조합하여 평면 스캔 디지털 카이모그래피 영상을 구성할 프레임을 생성한다(단계 S440). 바람직하게, 프레임 생성 모듈(223)은 고속 후두내시경 영상의 추출된 각 프레임의 화소 정보를, 화소 정보를 추출한 화소 정보 추출 위치에 따라, 평면 스캔 디지털 카이모그래피 영상의 프레임에서 대응되는 화소 위치의 화소 정보로 설정할 수 있다.모든 고속 후두내시경 영상의 프레임을 대상으로 상기의 화소 정보 추출 과정을 수행하여 평면 스캔 디지털 카이모그래피 영상의 프레임들을 생성할 수 있다. The frame generation module 223 combines the extracted pixel information of each frame to generate a frame for constructing a planar scan digital chymography image (step S440). Preferably, the frame generation module 223 uses the pixel information of each extracted frame of the high-speed laryngeal endoscope image according to the pixel information extraction position from which the pixel information is extracted, and the pixel at the pixel position corresponding to the frame of the planar scan digital chymography image. The pixel information extraction process may be performed on all frames of the high-speed laryngeal endoscope image to generate frames of the planar scan digital chymograph image.
일 실시예에서, 프레임 생성 모듈(223)은 생성된 평면 스캔 디지털 카이모그래피 영상의 프레임의 밝기, 채도, 블러링(blurring), 선명도, 또는 회전을 보정할 수 있다.In one embodiment, the frame generation module 223 may correct brightness, saturation, blurring, sharpness, or rotation of a frame of the generated planar scan digital chymograph image.
영상 생성 모듈(224)은 프레임을 조합하여 평면 스캔 디지털 카이모그래피 영상을 생성한다(단계 S450). 바람직하게, 영상 생성 모듈(224)은 생성한 평면 스캔 디지털 카이모그래피 영상을 내부 저장 장치 또는 외부 저장 장치에 저장하거나 또는 영상 관찰 서버(150)에 연결된 디스플레이 장치로 출력할 수 있다. The image generation module 224 combines the frames to generate a planar scan digital chymography image (step S450). Preferably, the image generation module 224 may store the generated planar scan digital chymography image in an internal storage device or an external storage device, or output the generated flat scan digital chymography image to a display device connected to the image observation server 150.
바람직하게, 카메라(130)의 외부 트리거의 동작 여부는 사용자에 의하여 실시간으로 전환될 수 있다. 즉, 영상 획득 중에 카메라(130)의 외부 트리거의 기능은 실시간으로 전환이 가능하므로, 트리거 기능이 동작하지 않는 상태에서 수행되는 평면 스캔 디지털 카이모그래피 영상 생성부(220)에 의한 평면 스캔 디지털 카이모그래피 영상 생성 방법과 트리거 기능이 동작하는 상태에서 수행되는 후두 스트로보스코피 영상 생성부(210)에 의한 후두 스트로보스코피 영상 생성 방법의 전환은 큰 지연 시간 없이 실시간으로 가능하다.Preferably, whether the external trigger of the camera 130 is operated may be switched in real time by the user. That is, since the function of the external trigger of the camera 130 can be switched in real time during the image acquisition, the planar scan digital chymography by the planar scan digital chymography image generator 220 performed in a state where the trigger function is not operated. Switching of the laryngeal stroboscopic image generation method by the laryngeal stroboscopic image generation unit 210 which is performed while the image generation method and the trigger function are operated is possible in real time without a large delay time.
도 6은 고속 후두내시경 영상 및 다중 프레임 후두 스트로보스코피 영상을 나타내는 예시도이다.6 is an exemplary diagram illustrating a fast laryngeal endoscope image and a multi-frame laryngeal stroboscopy image.
도 6을 참조하면, 기본 주파수가 160Hz에 해당하는, 즉, 160Hz로 발성하는 피검자의 성대를 카메라(130)로 촬영하여 얻은 160장의 정지 영상을 나열한 것이다.Referring to FIG. 6, 160 still images obtained by photographing the vocal cords of a subject whose basic frequency corresponds to 160 Hz, that is, 160 Hz, are captured by the camera 130.
도 6의 (a)를 참조하면, 1,350FPS 카메라(130)로 촬영한 고속 후두내시경 영상으로서, 약 0.12초 동안 160장의 정지 영상이 생성된 것이고, 한 주기의 성대의 움직임은 약 9장의 정지 영상에 의하여 나타난다. 또한, 도 6의 (a)에 해당하는 고속 후두내시경 영상이 촬영되는 동안 해당 영상은 실시간으로 디스플레이 장치를 통하여 확인될 수 있다.Referring to (a) of FIG. 6, a high-speed laryngeal endoscope image captured by the 1,350 FPS camera 130 generates 160 still images for about 0.12 seconds, and the movement of the vocal cords in one cycle is about 9 still images. Appears. In addition, while the high-speed laryngoscope image corresponding to (a) of FIG. 6 is photographed, the corresponding image may be confirmed through a display device in real time.
이에 더하여, 도 6의 (a)에서, 빨간색 실선으로 표시한 프레임은 초당 30프레임 정도로 촬영하는 종래의 후두 스트로보스코피 영상 촬영 장치로 촬영되는 것으로서, 고속 후두 내시경 영상을 통하여 매 4주기의 성대 움직임이 촬영되는 동안 종래의 후두 스트로보스코피 영상 촬영 장치는 빨간색 실선으로 표시된 한 프레임만을 촬영한다. In addition, in (a) of FIG. 6, the frame indicated by the solid red line is photographed by a conventional laryngeal stroboscopic imaging apparatus photographing at about 30 frames per second. The conventional laryngeal stroboscopy imaging apparatus captures only one frame indicated by a solid red line while being photographed.
도 6의 (b)를 참조하면, 영상 관찰 서버(150)의 후두 스트로보스코피 영상 생성부(210)에 의하여 획득된 다중 프레임 후두 스트로보스코피 영상으로 1초 동안 160장의 정지 영상이 생성된 것이고, 한 주기의 성대의 움직임은 160장의 정지 영상에 의하여 나타난다. 즉, 본 발명에 따른 다중 프레임 후두 스트로보스코피 영상은 한 주기 성대의 움직임이 발성주파수와 거의 동일한 프레임 수로 구성된다. 바람직하게, 도 6의 (b)에 해당하는 후두 스트로보스코피 영상이 촬영되는 동안 해당 영상은 실시간으로 디스플레이 장치를 통하여 확인될 수 있으며, 따라서 디스플레이 장치를 통하여 성대가 움직이는 동안 성대의 모양이 시각적으로 확인될 수 있다. 반면, 종래의 후두 스트로보스코피 영상 촬영 장치로 촬영하여 생성된 후두 스트로보스코피 영상은 한 주기 성대의 움직임이 35 프레임 정도로 구성된다. Referring to FIG. 6 (b), 160 still images are generated for one second from a multi-frame laryngeal stroboscopic image obtained by the laryngeal stroboscopic image generator 210 of the image observation server 150. The movement of the vocal cords of the cycle is represented by 160 still images. That is, in the multi-frame laryngeal stroboscopy image according to the present invention, the movement of one vocal cord is composed of the number of frames which is almost equal to the phonation frequency. Preferably, while the laryngeal stroboscopic image corresponding to (b) of FIG. 6 is photographed, the image may be confirmed in real time through the display device, and thus, the shape of the vocal cords is visually confirmed while the vocal cord is moved through the display device. Can be. On the other hand, the laryngeal stroboscopy image generated by the conventional laryngeal stroboscopy image capturing apparatus is composed of about 35 frames of movement of one vocal cord.
도 7은 고속 후두내시경 영상과 본 발명에 의하여 생성된 후두 스트로보스코피 영상을 나타내는 다른 예시도이다.7 is another exemplary diagram illustrating a fast laryngeal endoscope image and a laryngeal stroboscopic image generated by the present invention.
도 7을 참조하면, 기본 주파수가 100Hz에 해당하는, 즉, 100Hz로 발성하는 피검자의 성대를 카메라(130)로 촬영하여 얻은 정지 영상을 시간 순서로 나열한 것으로서, 각각 외부 트리거의 기능이 동작하지 않는 경우에 획득된 고속 후두내시경 영상(710), 및 외부 트리거의 기능이 동작하는 경우에 획득된 다중 프레임 후두 스트로보스코피 영상(720 및 730)에 해당한다.Referring to FIG. 7, the still images obtained by capturing the vocal cords of a test subject having a basic frequency of 100 Hz, that is, 100 Hz, by the camera 130 are arranged in chronological order, and the function of the external trigger does not operate. Corresponding to the fast laryngeal endoscope image 710 obtained in the case, and the multi-frame laryngeal stroboscopic images 720 and 730 obtained when the function of the external trigger operates.
고속 후두내시경 영상(710)을 참조하면, 한 주기의 성대의 움직임은 양 4장의 정지 영상에 의하여 나타나고, 도 6의 (a)를 참조하여 설명한 바와 같이, 성대가 빠르게 움직이는 영역은 잔상에 의하여 성대의 모양이 뚜렷하게 확인되기 어렵다.Referring to the high-speed laryngoscope image 710, the movement of the vocal cords of one cycle is represented by both four still images, and as described with reference to FIG. The shape of is hard to see clearly.
다중 프레임 후두 스트로보스코피 영상(720)을 참조하면, 첫번째 프레임부터 10번째 프레임까지 획득되는 시간에 따른 영상을 나타낸 것이고, 다중 프레임 후두 스트로보스코피 영상(730)은 첫번째 프레임부터 101번째 프레임까지 획득되는 시간에 따른 영상을 나타낸 것이다. 여기에서, 다중 프레임 후두 스트로보스코피 영상(730)의 첫번째 프레임부터 100번째 프레임 사이에는, 획득된 영상을 생략하였으나, 다중 프레임 후두 스트로보스코피 영상(720)의 첫번째 프레임부터 10번째 프레임까지의 영상이 획득된다.Referring to the multi-frame laryngeal stroboscopic image 720, the image is obtained according to the time obtained from the first frame to the 10th frame, and the multi-frame laryngeal stroboscopic image 730 is the time obtained from the first frame to the 101st frame. It shows the image according to. Here, although the acquired image is omitted between the first frame and the 100th frame of the multi-frame laryngeal stroboscopic image 730, the image from the first frame to the 10th frame of the multi-frame laryngeal stroboscopic image 720 is obtained. do.
즉, 기존 고속 카메라를 이용하여 높은 주파수로 발성하는 피검자의 후두내시경이 촬영되는 경우, 성대가 열리고 닫히는 한 주기 동안 소수의 정지 영상만이 획득되고, 성대 진동 한 주기 당 2~6 프레임 전후의 팔랑거리는 영상(flagging images)만이 관찰 되어 고속 후두내시경 카메라로서의 기능은 거의 볼 수 없었으나, 본 발명에 따르면, 피검자의 기본 주파수를 기초로 외부 트리거를 이용하여 카메라(130)를 통해 정지 영상을 촬영하므로, 높은 주파수로 발성하는 피검자일수록 더 많은 수의 정지 영상이 획득될 수 있다.In other words, when a laryngoscope of a patient speaking at a high frequency using an existing high speed camera is photographed, only a few still images are acquired during one cycle of opening and closing the vocal cords, and about 2-6 frames per cycle of the vocal cord oscillation. Since only the flagging images were observed in the distance, almost no function as a high-speed laryngoscopy camera was observed, but according to the present invention, since the still image is captured by the camera 130 using an external trigger based on the basic frequency of the examinee. In other words, a higher number of still images may be acquired by a person speaking at a higher frequency.
예를 들어, 외부 트리거의 기능 없이 후두내시경 영상을 촬영하기 위해서 개발된 고속 카메라의 경우, 최대 획득 프레임 수는 초당 약 8,000 프레임(8,000FPS)으로 대부분 초당 약 3,000 프레임의 정지 영상을 획득 할 수 있고 영상의 해상도 또한 매우 작다. 성인 남성과 여성의 편안한 발성(남성: 약 125Hz, 여성: 약 200Hz) 상태에서 후두내시경 영상이 해당 8,000 FPS 카메라로 촬영되는 경우 성대가 한번 열리고 닫히는 동안(1Hz) 남성은 64장 및 여성은 40장의 정지 영상이 획득될 수 있었다.For example, in the case of a high-speed camera developed for capturing laryngoscope images without the function of an external trigger, the maximum number of frames acquired is about 8,000 frames per second (8,000 FPS), and most of the still images of about 3,000 frames can be obtained. The resolution of the image is also very small. When laryngoscope images are taken with the corresponding 8,000 FPS camera with comfortable vocalization (male: approx. 125 Hz, female: approx. 200 Hz) in adult men and women, 64 men and 40 women Still images could be obtained.
반면, 본 발명에 의한 카메라(130), 즉, 후두 스트로보스코피 기술을 지원하는 VGA급 해상도의 600~1,550FPS 카메라를 사용하여 동일한 대상의 후두내시경 영상이 촬영되면 남성은 125장 및 여성은 200장의 정지 영상이획득될 수 있다. 또한, 정지 영상의 해상도 또한 VGA급으로 8,000FPS 카메라보다 더 좋은 영상 화질의 결과물이 얻어질 수 있다. 다른 예를 들어,본 발명에 의한 카메라(130)를 이용하면 최대 600Hz에 해당하는 피검자의 음성 발성에 대하여 600장의 정지 영상이 획득될 수 있다. 또 다른 예를 들어, 카메라(130)의 해상도가 VGA가 아닌 QVGA로 설정되는 경우에는 최대 1,550 FPS로 정지영상이 획득될 수 있으며, 이 환경에서는 최대 1,550Hz에 해당하는 피검자의 음성 발성에 대하여 1,550장의 정지 영상이 획득될 수 있다.On the other hand, when the camera 130 according to the present invention, that is, laryngoscope images of the same target using a 600 ~ 1,550 FPS camera of VGA resolution supporting laryngeal stroboscopy technology, 125 men and 200 women Still images can be acquired. In addition, the resolution of the still image is also VGA-class, resulting in a better image quality than the 8,000 FPS camera. As another example, when the camera 130 according to the present invention is used, 600 still images may be acquired with respect to voice utterance of a subject corresponding to a maximum of 600 Hz. As another example, when the resolution of the camera 130 is set to QVGA instead of VGA, still images may be acquired at a maximum of 1,550 FPS, and in this environment, 1,550 for a voice of a subject corresponding to a maximum of 1,550 Hz may be obtained. Intestinal still images may be obtained.
한편, 본 발명의 일 실시예에 따른 영상 생성 방법은 또한 컴퓨터로 읽을 수있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다.On the other hand, the image generating method according to an embodiment of the present invention can also be implemented as computer-readable code on a computer-readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data that can be read by a computer system is stored.
예컨대, 컴퓨터가 읽을 수 있는 기록매체로는 롬(ROM), 램(RAM), 시디-롬(CD-ROM), 자기 테이프, 하드디스크, 플로피디스크, 이동식 저장장치, 비휘발성메모리(Flash Memory), 광 데이터 저장장치 등이 있다.For example, a computer-readable recording medium may be a ROM, a RAM, a CD-ROM, a magnetic tape, a hard disk, a floppy disk, a removable storage device, a nonvolatile memory (Flash memory). Optical data storage.
또한, 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다.The computer readable recording medium can also be distributed over computer systems connected through a computer communication network and stored and executed as readable code in a distributed fashion.
전술한 본 발명에 따른 영상 생성 시스템에 대한 바람직한 실시예에 대하여 설명하였지만, 본 발명은 이에 한정되는 것이 아니고 특허청구범위와 발명의 상세한 설명 및 첨부한 도면의 범위 안에서 여러가지로 변형하여 실시하는 것이 가능하고 이 또한 본 발명에 속한다.Although a preferred embodiment of the image generating system according to the present invention has been described above, the present invention is not limited thereto, and various modifications can be made within the scope of the claims and the detailed description of the invention and the accompanying drawings. This also belongs to the present invention.
[부호의 설명][Description of the code]
100: 영상 생성 시스템100: image generation system
110: 광원장치 120: 후두경110: light source device 120: laryngoscope
130: 카메라 140: 외부 트리거 130: camera 140: external trigger
150: 영상 관찰 서버 161 내지 164: 영상150: video observation server 161 to 164: video
210: 후두 스트로보스코피 영상 생성부210: laryngeal stroboscopic image generation unit
211: 음성 및 진동 신호 수신 모듈 212: 트리거 주파수 설정 모듈211: voice and vibration signal receiving module 212: trigger frequency setting module
213: 트리거 신호 제공 모듈 214: 영상 수신 모듈213: trigger signal providing module 214: video receiving module
215: 영상 생성 모듈215: image generation module
220: 평면 스캔 디지털 카이모그래피 영상 생성부220: planar scan digital chymography image generating unit
221: 영상 수신 모듈 222: 화소 정보 추출 모듈221: image receiving module 222: pixel information extraction module
223: 프레임 생성 모듈 224: 영상 생성 모듈223: frame generation module 224: image generation module
230: 제어230: control

Claims (15)

  1. 실시간 후두 스프로보스코피, 고속 후두경 검사, 및 평면 스캔 디지털 카이모그래피를 위한 영상 생성 시스템에 있어서,In an image generation system for real-time laryngeal sproboscopy, high-speed laryngoscopy, and planar scan digital chymography,
    성대를 비추기 위한 연속 광원을 발광시키는 광원장치;A light source device for emitting a continuous light source for illuminating the vocal cords;
    외부 트리거의 기능을 구비하고, 상기 성대를 촬영하는 카메라; 및A camera having a function of an external trigger and photographing the vocal cords; And
    상기 외부 트리거의 동작 여부에 따라 상기 카메라로부터 촬영된 영상을 기초로 후두 스트로보스코피 영상 또는 평면 스캔 디지털 카이모그래피 영상을 생성하는 영상 관찰 서버를 포함하는 영상 생성 시스템.And an image observation server configured to generate a laryngeal stroboscopic image or a planar scan digital chymography image based on the image taken from the camera according to whether the external trigger is operated.
  2. 제1항에 있어서, 상기 광원장치는,The method of claim 1, wherein the light source device,
    제논 광원에 해당하는 연속 광원을 발광시키는 것을 특징으로 하는 영상 생성 시스템.And a continuous light source corresponding to the xenon light source.
  3. 제1항에 있어서, 상기 카메라는,The method of claim 1, wherein the camera,
    초당 600~1,550 프레임의 영상을 획득하는 고속 카메라에 해당하는 것을 특징으로 하는 영상 생성 시스템.An image generating system, characterized in that it corresponds to a high-speed camera that acquires an image of 600 ~ 1,550 frames per second.
  4. 제1항에 있어서, 상기 영상관찰서버는,According to claim 1, The video observation server,
    상기 카메라의 외부 트리거의 기능이 동작하는 경우, 상기 성대에 대한 후두 스트로보스코피 영상을 생성하는 후두 스트로보스코피 영상 생성부; 및A laryngeal stroboscopic image generation unit configured to generate a laryngeal stroboscopic image of the vocal cords when a function of an external trigger of the camera is operated; And
    상기 카메라의 외부 트리거의 기능이 동작하지 않는 경우, 상기 성대에 대한 평면 스캔 디지털 카이모그래피 영상을 생성하는 평면 스캔 디지털 카이모그래피 영상 생성부를 포함하는 것을 특징으로 하는 영상 생성 시스템.And a planar scan digital chymography image generator for generating a planar scan digital chymography image for the vocal cords when the function of the external trigger of the camera does not operate.
  5. 제4항에 있어서, 상기 후두 스트로보스코피 영상 생성부는The laryngeal stroboscopy image generation unit of claim 4.
    피검자의 음성 및 진동 신호를 수신하는 음성 및 진동 신호 수신모듈;A voice and vibration signal receiving module for receiving a voice and vibration signal of the examinee;
    상기 음성 및 진동 신호의 기본 주파수를 기초로 트리거 주파수를 설정하는 트리거 주파수 설정 모듈;A trigger frequency setting module for setting a trigger frequency based on a fundamental frequency of the voice and vibration signals;
    상기 트리거 주파수에 따라 트리거 신호를 상기 카메라에 제공하는 트리거 신호 제공 모듈; A trigger signal providing module for providing a trigger signal to the camera according to the trigger frequency;
    상기 트리거 신호에 따라 상기 카메라에 의하여 촬영된 영상을 수신하는 영상 수신모듈; 및An image receiving module which receives an image photographed by the camera according to the trigger signal; And
    상기 수신된 영상을 조합하여 상기 후두 스트로보스코피 영상을 생성하는 영상 생성 모듈을 포함하는 것을 특징으로 하는 영상 생성 시스템.And an image generation module for combining the received images to generate the laryngeal stroboscopic image.
  6. 제5항에 있어서, 상기 음성 및 진동 신호 수신모듈은,The method of claim 5, wherein the voice and vibration signal receiving module,
    상기 피검자의 윤상 연골 아래의 경부 중앙에 부착된 진동 검출기 또는 마이크로부터 상기 음성 및 진동 신호를 수신하는 것을 특징으로 하는 영상 생성 시스템.And receiving the voice and vibration signals from a vibration detector or a microphone attached to the center of the neck under the annular cartilage of the subject.
  7. 제5항에 있어서, 상기 트리거주파수 설정 모듈은,The method of claim 5, wherein the trigger frequency setting module,
    상기 기본 주파수에 특정 주파수를 가감한 값을 상기 트리거 주파수로 설정하되, 상기 특정 주파수는 1Hz 내지 0.5Hz에 해당하는 것을 특징으로 하는 영상 생성 시스템.And a value obtained by adding or subtracting a specific frequency to the basic frequency as the trigger frequency, wherein the specific frequency corresponds to 1 Hz to 0.5 Hz.
  8. 제5항에 있어서, 상기 영상 수신 모듈은,The method of claim 5, wherein the image receiving module,
    상기 트리거 신호에 따라 상기 카메라에 의하여 촬영된,상기 성대의 움직임에 따른 연속적인 주기의 영상에서 특정 부분에 해당하는 한 프레임의 정지 영상을수신하고, 상기 수신된 정지 영상을 순차적으로 저장하되,Receiving a still image of one frame corresponding to a specific part of the image of the continuous cycle according to the movement of the vocal cords taken by the camera according to the trigger signal, and sequentially stores the received still image,
    상기 정지 영상은 상기 연속적인 주기의 영상에서 특정 주파수 이내로 샘플링 되는 것을 특징으로 하는 영상 생성 시스템.And the still image is sampled within a specific frequency in the image of the continuous period.
  9. 제8항에 있어서, 상기 영상 생성 모듈은, The method of claim 8, wherein the image generation module,
    상기 저장된 정지 영상들을 조합하여상기 성대의 움직임에 대한 한 주기의 가상 영상을 생성하는 것을 특징으로 하는 영상 생성 시스템.And combining the stored still images to generate a virtual image of one cycle of the movement of the vocal cords.
  10. 제4항에 있어서, 상기 평면 스캔 디지털 카이모그래피 영상 생성부는,The method of claim 4, wherein the planar scan digital chymography image generating unit,
    상기 카메라에 의하여 촬영된 영상을 수신하는 영상 수신 모듈;An image receiving module which receives an image photographed by the camera;
    상기 영상으로부터 대상 영역 및 단위 화소를 설정하고, 상기 대상 영역 및 단위 화소에 따라 각 프레임의 화소 정보를 추출하는 화소 정보 추출 모듈;A pixel information extraction module configured to set a target area and a unit pixel from the image, and extract pixel information of each frame according to the target area and the unit pixel;
    상기 추출된 각 프레임의 화소 정보를 조합하여 상기 평면 스캔 디지털 카이모그래피 영상을 구성할 프레임을 생성하는 프레임 생성 모듈; 및A frame generation module configured to combine the pixel information of each extracted frame to generate a frame for constructing the planar scan digital chymograph image; And
    상기 프레임을 조합하여 평면 스캔 디지털 카이모그래피 영상을 생성하는 영상 생성 모듈을 포함하는 것을 특징으로 하는 영상 생성 시스템.And an image generation module for combining the frames to generate a planar scan digital chymography image.
  11. 제1항에 있어서, The method of claim 1,
    상기 카메라의 상기 외부 트리거의 동작 여부는 실시간으로 전환되는 것을 특징으로 하는 영상 생성 시스템.Image generation system, characterized in that the operation of the external trigger of the camera is switched in real time.
  12. 광원장치, 카메라, 및 영상 관찰 서버를 포함하는, 실시간 후두 스프로보스코피, 고속 후두경 검사, 및 평면 스캔 디지털 카이모그래피를 위한 영상 생성 시스템에서 수행되는 영상 생성 방법에 있어서,An image generating method performed in an image generating system for real-time laryngeal sproboscopy, high-speed laryngoscope, and planar scan digital chymography, comprising a light source device, a camera, and an image observation server,
    (a) 상기 카메라에 구비된 외부 트리거의 기능의 동작 여부를 확인하는 단계; 및(a) checking whether an external trigger function provided in the camera is operated; And
    (b) 상기 외부 트리거의 동작 여부에 따라 상기 카메라로부터 촬영된 영상을 기초로 후두 스트로보스코피 영상 또는 평면 스캔 디지털 카이모그래피 영상을 생성하는 단계를 포함하는 영상 생성 방법.and (b) generating a laryngeal stroboscopic image or a planar scan digital chymograph image based on the image taken from the camera according to whether the external trigger is operated.
  13. 제12항에 있어서, 상기 (b) 단계는,The method of claim 12, wherein step (b) comprises:
    (b-1) 상기 카메라의 외부 트리거의 기능이 동작하는 경우, 상기 성대에 대한 후두 스트로보스코피 영상을 생성하는 단계; 및(b-1) generating a laryngeal stroboscopic image of the vocal cords when a function of an external trigger of the camera is operated; And
    (b-2) 상기 카메라의 외부 트리거의 기능이 동작하지 않는 경우, 상기 성대에 대한 평면 스캔 디지털 카이모그래피 영상을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 생성 방법.(b-2) generating a planar scan digital chymography image of the vocal cords when the function of the external trigger of the camera does not operate.
  14. 제13항에 있어서, 상기 (b-1) 단계는,The method of claim 13, wherein step (b-1) comprises:
    피검자의 음성 및 진동신호를 수신하는 단계;Receiving a voice and a vibration signal of the examinee;
    상기 음성 및 진동신호의 기본 주파수를 기초로 트리거 주파수를 설정하는 단계;Setting a trigger frequency based on a fundamental frequency of the voice and vibration signals;
    상기 트리거 주파수에 따라 트리거 신호를 상기 카메라에 제공하는 단계;Providing a trigger signal to the camera according to the trigger frequency;
    상기 트리거 신호에 따라 상기 카메라에 의하여 촬영된 영상을 수신하는 단계; 및Receiving an image photographed by the camera according to the trigger signal; And
    상기 수신된 영상을 조합하여 상기 후두 스트로보스코피 영상을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 생성 방법.And combining the received images to generate the laryngeal stroboscopy image.
  15. 제13항에 있어서, 상기 (b-2) 단계는,The method of claim 13, wherein step (b-2) comprises:
    상기 카메라에 의하여 촬영된 영상을 수신하는 단계;Receiving an image photographed by the camera;
    상기 영상으로부터 대상 영역 및 단위 화소를 설정하고, 상기 대상 영역 및 단위 화소에 따라 각 프레임의 화소 정보를 추출하는 단계;Setting a target region and a unit pixel from the image, and extracting pixel information of each frame according to the target region and unit pixel;
    상기 추출된 각 프레임의 화소 정보를 조합하여 상기 평면 스캔 디지털 카이모그래피 영상을 구성할 프레임을 생성하는 단계; 및Generating a frame to compose the planar scan digital chymograph image by combining pixel information of each extracted frame; And
    상기 프레임을 조합하여 평면 스캔 디지털 카이모그래피 영상을 생성하는 단계를 포함하는 것을 특징으로 하는 영상 생성 방법.Combining the frames to generate a planar scan digital chymograph image.
PCT/KR2017/001876 2016-03-02 2017-02-21 Image generation system and method for real-time laryngeal videostroboscopy, high speed videolaryngoscopy, and plane scan digital kymography WO2017150836A1 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20160025133 2016-03-02
KR10-2016-0025133 2016-03-02
KR1020160162835A KR101908632B1 (en) 2016-03-02 2016-12-01 System and method for generating image for real-time visualization of laryngeal video-stroboscopy, high-speed videolaryngoscopy, and virtual two dimensional scanning digital kymography-development
KR10-2016-0162835 2016-12-01

Publications (1)

Publication Number Publication Date
WO2017150836A1 true WO2017150836A1 (en) 2017-09-08

Family

ID=59744166

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2017/001876 WO2017150836A1 (en) 2016-03-02 2017-02-21 Image generation system and method for real-time laryngeal videostroboscopy, high speed videolaryngoscopy, and plane scan digital kymography

Country Status (1)

Country Link
WO (1) WO2017150836A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109793486A (en) * 2017-11-16 2019-05-24 卡尔史托斯影像有限公司 Improved vocal cords stroboscope photograph inspection
WO2021161394A1 (en) * 2020-02-10 2021-08-19 オリンパス株式会社 Image processing device, imaging system, image processing method, and program

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990079315A (en) * 1998-04-03 1999-11-05 박광석 Video Strobochemography for Analysis of Vocal Cord Mucomotor Status
JP2004166761A (en) * 2002-11-18 2004-06-17 Machida Endscope Co Ltd Vibrating object observing system and vocal cord observing processing apparatus
US20050219376A1 (en) * 2004-03-08 2005-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Image recording device having several image recording modes
KR20080001766U (en) * 2006-12-08 2008-06-12 유메디칼 주식회사 Portable Laryngeal Stroboscope Using Vibration pick-up
US20090281390A1 (en) * 2006-05-26 2009-11-12 Stichting Voor De Technische Wetenschappen Optical Triggering System For Stroboscopy, And A Stroboscopic System
KR20140115526A (en) * 2013-03-21 2014-10-01 김태우 2D Scanning Videokymography System for analyzing vibration of the vocal fold and Method of analyzing vibration of the vocal fold using the same

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990079315A (en) * 1998-04-03 1999-11-05 박광석 Video Strobochemography for Analysis of Vocal Cord Mucomotor Status
JP2004166761A (en) * 2002-11-18 2004-06-17 Machida Endscope Co Ltd Vibrating object observing system and vocal cord observing processing apparatus
US20050219376A1 (en) * 2004-03-08 2005-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Image recording device having several image recording modes
US20090281390A1 (en) * 2006-05-26 2009-11-12 Stichting Voor De Technische Wetenschappen Optical Triggering System For Stroboscopy, And A Stroboscopic System
KR20080001766U (en) * 2006-12-08 2008-06-12 유메디칼 주식회사 Portable Laryngeal Stroboscope Using Vibration pick-up
KR20140115526A (en) * 2013-03-21 2014-10-01 김태우 2D Scanning Videokymography System for analyzing vibration of the vocal fold and Method of analyzing vibration of the vocal fold using the same

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109793486A (en) * 2017-11-16 2019-05-24 卡尔史托斯影像有限公司 Improved vocal cords stroboscope photograph inspection
CN109793486B (en) * 2017-11-16 2023-08-04 卡尔史托斯影像有限公司 Improved vocal cord strobe photography examination
WO2021161394A1 (en) * 2020-02-10 2021-08-19 オリンパス株式会社 Image processing device, imaging system, image processing method, and program

Similar Documents

Publication Publication Date Title
US20050219376A1 (en) Image recording device having several image recording modes
WO2017192020A1 (en) Dental three-dimensional data processing device and method thereof
US11666209B2 (en) Video endoscopy
JP2004166761A (en) Vibrating object observing system and vocal cord observing processing apparatus
WO2013095032A1 (en) Method for automatically detecting mid-sagittal plane by using ultrasound image and apparatus thereof
WO2017150836A1 (en) Image generation system and method for real-time laryngeal videostroboscopy, high speed videolaryngoscopy, and plane scan digital kymography
US9808195B2 (en) 2D scanning videokymography system for analyzing vibration of vocal-fold mucosa, and method of analyzing vibration of vocal-fold mucosa using the same
WO2018235420A1 (en) Medical information processing system
US10888218B2 (en) Video laryngeal endoscope system including 2D scan video kymography and laryngeal stroboscopy
WO2017039124A1 (en) Method for generating planar scan videokymographic images by using real-time or pre-stored ultra-high speed laryngendoscopic images, planar scan videokymographic image generation server for performing same, and recording medium for storing same
KR101247513B1 (en) Method and System for Recording and Reproducing Surgical Operation Scenes
KR101739050B1 (en) Integrated strobe flash light laryngeal stroboscope apparatus equipped also implementable with continuous light source
KR20220112029A (en) Laryngeal performance test method using voice pitch detection and light source blinking algorithm
WO2022118939A1 (en) Camera, method for generating trained model pertaining to respiratory infection, trained model pertaining to respiratory infection, automatic diagnosis method pertaining to respiratory infection, and computer program
WO2019164273A1 (en) Method and device for predicting surgery time on basis of surgery image
Mehta et al. The evolution of methods for imaging vocal fold phonatory function
WO2022220639A1 (en) Mobile autoscope system
JP2022179218A (en) Endoscope system and operation method thereof
JPH0852109A (en) Endoscopy system having radioscopic diagnosis apparatus
KR20030046787A (en) Digital stroboscope with continuous light source
JP4360823B2 (en) Electronic endoscope system
JPH07123345A (en) Hard copy device for ultrasonic endoscope
Stasicki et al. Color high-speed video stroboscope system for inspection of human larynx
KR20120088612A (en) Method and System for Recording and Reproducing Surgical Operation Scenes
JPH02265523A (en) Image playback system

Legal Events

Date Code Title Description
NENP Non-entry into the national phase

Ref country code: DE

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17760240

Country of ref document: EP

Kind code of ref document: A1

122 Ep: pct application non-entry in european phase

Ref document number: 17760240

Country of ref document: EP

Kind code of ref document: A1