A RetroSearch Logo

Home - News ( United States | United Kingdom | Italy | Germany ) - Football scores

Search Query:

Showing content from https://patents.google.com/patent/JP2000214888A/en below:

JP2000214888A - Sound coding device, optical record medium, sound decoding device, sound transmitting method and transmission medium

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、マルチチャネルの
音声信号を予測符号化するための音声符号化装置、光記
録媒体、音声復号装置、音声伝送方法及び伝送媒体に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an audio encoding device for predictively encoding a multi-channel audio signal, an optical recording medium, an audio decoding device, an audio transmission method, and a transmission medium.

【0002】[0002]

【従来の技術】音声信号を予測符号化する方法として、
本発明者は先の出願(特願平9−289159号)にお
いて1チャネルの原デジタル音声信号に対して、特性が
異なる複数の予測器により時間領域における過去の信号
から現在の信号の複数の線形予測値を算出し、原デジタ
ル音声信号と、この複数の線形予測値から予測器毎の予
測残差を算出し、予測残差の最小値を選択する方法を提
案している。
2. Description of the Related Art As a method of predictive encoding of a speech signal,
In the prior application (Japanese Patent Application No. 9-289159), the inventor of the present invention applied a plurality of linearizers of a current signal from a past signal in the time domain to a one-channel original digital audio signal using a plurality of predictors having different characteristics. A method is proposed in which a prediction value is calculated, a prediction residual for each predictor is calculated from the original digital audio signal and the plurality of linear prediction values, and a minimum value of the prediction residual is selected.

【0003】[0003]

【発明が解決しようとする課題】しかしながら、上記方
法では原デジタル音声信号がサンプリング周波数=96
kHz、量子化ビット数=20ビット程度の場合にある
程度の圧縮効果を得ることができるが、近年のDVDオ
ーディオディスクではこの2倍のサンプリング周波数
(=192kHz)が使用され、また、量子化ビット数
も24ビットが使用される傾向があるので、圧縮率を改
善する必要がある。さらに、入力マルチチャンネル音声
信号をステレオ2チャネルで再生したり、マルチチャン
ネルで再生したりすることを考慮しなければならない。
However, in the above method, the original digital audio signal has a sampling frequency = 96.
Although a certain compression effect can be obtained when the kHz and the quantization bit number are about 20 bits, recent DVD audio discs use twice the sampling frequency (= 192 kHz). Since 24 bits also tend to be used, the compression ratio needs to be improved. In addition, it must be considered that the input multi-channel audio signal is reproduced on two stereo channels or reproduced on multiple channels.

【0004】そこで本発明は、マルチチャネルの音声信
号を予測符号化する場合に圧縮率を改善することができ
るとともに、グループ分けしてステレオ2チャネルやマ
ルチチャンネルで再生することができる音声符号化装
置、光記録媒体、音声復号装置、音声伝送方法及び伝送
媒体を提供することを目的とする。
[0004] Accordingly, the present invention provides an audio encoding apparatus which can improve the compression ratio when predictive encoding of a multi-channel audio signal is performed, and which can be reproduced in two stereo channels or multi channels by grouping. It is an object to provide an optical recording medium, an audio decoding device, an audio transmission method, and a transmission medium.

【0005】[0005]

【課題を解決するための手段】本発明は上記目的を達成
するために、以下の1)〜5)に記載の手段より成るも
のである。すなわち、
Means for Solving the Problems In order to achieve the above object, the present invention comprises the following means 1) to 5). That is,

【0006】1)元のマルチチャネルの音声信号を少な
くとも前方2チャネルを含む第1のグループと他のチャ
ネルを含む第2のグループに分類して、少なくとも前記
第2のグループのチャネルの音声信号を相関性のある音
声信号に変換する相関手段と、前記第1のグループと前
記第2のグループの相関性のある音声信号の複数の予測
値をチャネル毎に算出し、この複数の予測値の各予測残
差を算出し、この複数の予測残差の最小値を選択する複
数の予測符号化手段と、前記予測符号化手段により選択
された予測残差を含む予測符号化データを前記第1、第
2のグループ毎に分類したビットストリームにフォーマ
ット化する手段とを、有する音声符号化装置。 2)請求項1記載の音声符号化装置において選択された
予測残差を含む予測符号化データが前記前方2チャネル
のグループと第2のグループ毎に分類されたビットスト
リームにフォーマット化されて記録された光記録媒体。 3)請求項1記載の音声符号化装置において選択された
予測残差を含む予測符号化データから予測値を算出し、
予測値から元のマルチチャネルの音声信号を復元するこ
とを特徴とする音声復号装置。 4)請求項1記載の音声符号化装置において選択された
予測残差を含む予測符号化データを通信回線を介して伝
送することを特徴とする音声伝送方法。 5)請求項1記載の音声符号化装置において選択された
予測残差を含む予測符号化データを伝送することを特徴
とする伝送媒体。
[0006] 1) The original multi-channel audio signals are classified into a first group including at least the front two channels and a second group including other channels, and the audio signals of at least the channels of the second group are classified. Correlating means for converting into a correlated audio signal; and calculating a plurality of predicted values of the correlated audio signal of the first group and the second group for each channel, A plurality of predictive encoding means for calculating a prediction residual and selecting a minimum value of the plurality of prediction residuals; and predictive coded data including the prediction residual selected by the predictive encoding means, in the first, Means for formatting into a bit stream classified for each second group. 2) In the speech encoding apparatus according to claim 1, the prediction coded data including the prediction residual selected is formatted and recorded in the bit stream classified into the group of the front two channels and the second group. Optical recording medium. 3) calculating a prediction value from the prediction coded data including the prediction residual selected in the speech coding apparatus according to claim 1;
An audio decoding device for restoring an original multi-channel audio signal from a predicted value. 4) A speech transmission method, characterized in that the speech encoding apparatus according to claim 1, wherein the prediction coded data including the prediction residual selected is transmitted via a communication line. (5) A transmission medium for transmitting predicted coded data including a prediction residual selected in the speech coding apparatus according to (1).

【0007】[0007]

【発明の実施の形態】以下、図面を参照して本発明を説
明する。図1は本発明に係る音声符号化装置及び音声復
号装置の第1の実施形態を示すブロック図、図2は図1
の符号化部を詳しく示すブロック図、図3は図1、図2
の符号化部により符号化されたビットストリームを示す
説明図、図4は図1の復号化部を詳しく示すブロック
図、図5はDVDのパックのフォーマットを示す説明
図、図6はDVDのオーディオパックのフォーマットを
示す説明図、図7、図8は音声伝送方法を示すフローチ
ャートである。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing a first embodiment of a speech encoding apparatus and a speech decoding apparatus according to the present invention, and FIG.
FIG. 3 is a block diagram showing the encoding unit of FIG.
FIG. 4 is a block diagram showing the decoding unit in FIG. 1 in detail, FIG. 5 is an explanatory diagram showing a DVD pack format, and FIG. 6 is a DVD audio system. FIGS. 7 and 8 are explanatory diagrams showing the format of a pack, and FIGS. 7 and 8 are flowcharts showing an audio transmission method.

【0008】ここで、マルチチャネル方式としては、例
えば次の4つの方式が知られている。 (1)4チャネル方式 ドルビーサラウンド方式の
ように、前方L、C、Rの3チャネル+後方Sの1チャ
ネルの合計4チャネル (2)5チャネル方式 ドルビーAC−3方式のS
Wチャネルなしのように、前方L、C、Rの3チャネル
+後方SL、SRの2チャネルの合計5チャネル (3)6チャネル方式 DTS(Digital Theater
System)方式や、ドルビーAC−3方式のように6チャ
ネル(L、C、R、SW(Lfe)、SL、SR) (4)8チャネル方式 SDDS(Sony Dynamic D
igital Sound)方式のように、前方L、LC、C、R
C、R、SWの6チャネル+後方SL、SRの2チャネ
ルの合計8チャネル
Here, for example, the following four systems are known as multi-channel systems. (1) Four-channel system Like the Dolby surround system, a total of four channels of three channels of front L, C, and R + one channel of rear S. (2) Five-channel system S of Dolby AC-3 system
As without W channel, 3 channels of front L, C and R + 2 channels of rear SL and SR, total 5 channels (3) 6 channel system DTS (Digital Theater)
6) (L, C, R, SW (Lfe), SL, SR) such as the Dolby AC-3 system (4) 8-channel system SDDS (Sony Dynamic D
digital sound), forward L, LC, C, R
6 channels of C, R, SW + 2 channels of rear SL, SR, total 8 channels

【0009】図1に示す符号化側の6チャネル(ch)ミ
クス&マトリクス回路1’は、マルチチャネル信号の一
例としてフロントレフト(Lf)、センタ(C)、フロ
ントライト(Rf)、サラウンドレフト(Ls)、サラ
ウンドライト(Rs)及びLfe(Low Frequency Effe
ct)の6chのPCMデータを係数mij(i=1,2,j
=1,2〜6)を用いて次式(1)によりステレオ2チ
ャネル(L、R)にダウンミクスする。 L=m11・Lf+m12・Rf+m13・C +m14・Ls+m15・Rs+m16・Lfe R=m21・Lf+m22・Rf+m23・C +m24・Ls+m25・Rs+m26・Lfe …(1)
The 6-channel (ch) mix and matrix circuit 1 'on the encoding side shown in FIG. 1 includes a front left (Lf), a center (C), a front right (Rf), a surround left ( Ls), surround light (Rs) and Lfe (Low Frequency Effe)
ct) of the 6-channel PCM data by coefficients mij (i = 1, 2, j)
= 1, 2 to 6), and downmixes to two stereo channels (L, R) by the following equation (1). L = m11 · Lf + m12 · Rf + m13 · C + m14 · Ls + m15 · Rs + m16 · Lfe R = m21 · Lf + m22 · Rf + m23 · C + m24 · Ls + m25 · Rs + m26 · Lfe (1)

【0010】またミクス&マトリクス回路1’は、元の
6ch(Lf、C、Rf、Ls、Rs、Lfe)を前方グ
ループに関する2chと他のグループに関する4chに分類
して4chを次式(2)のように、相関性のある信号
「3」〜「6」に変換し、2ch(L、R)を第1符号化
部2’−1に、また、4ch「3」〜「6」を第2符号化
部2’−2に出力する。 「1」=L 「2」=R 「3」=C−(Ls+Rs)/2 「4」=Ls+Rs 「5」=Ls−Rs 「6」=Lfe−C …(2)
The mix & matrix circuit 1 'classifies the original 6 channels (Lf, C, Rf, Ls, Rs, Lfe) into 2 channels for the front group and 4 channels for the other groups, and divides the 4 channels into the following equation (2). , And 2ch (L, R) to the first encoder 2′-1, and 4ch “3” to “6” to the third signal “3” to “6”. And outputs the result to the 2 coding unit 2′-2. “1” = L “2” = R “3” = C− (Ls + Rs) / 2 “4” = Ls + Rs “5” = Ls−Rs “6” = Lfe−C (2)

【0011】符号化部2’を構成する第1及び第2符号
化部2’−1、2’−2はそれぞれ、図2に詳しく示す
ように2ch「1」、「2」と4ch「3」〜「6」のPC
Mデータをチャネル毎に予測符号化し、予測符号化デー
タを図3に示すようなビットストリームで記録媒体5や
衛星回線や電話回線等の通信媒体6を介して復号側に伝
送する。復号側では復号化部3’を構成する第1及び第
2復号化部3’−1、3’−2により、図4に詳しく示
すようにそれぞれ前方グループに関する2ch「1」、
「2」と他のグループに関する4ch「3」〜「6」の予
測符号化データをチャネル毎にPCMデータに復号す
る。次いでミクス&マトリクス回路4’により式
(1)、(2)に基づいて元の6ch(Lf、C、Rf、
Ls、Rs、Lfe)を復元するとともに、ステレオ2
chデータ(L、R)をそのまま出力する。
As shown in detail in FIG. 2, the first and second encoders 2'-1 and 2'-2 which constitute the encoder 2 'respectively have 2ch "1", "2" and 4ch "3". "~" 6 "PC
The M data is predictively encoded for each channel, and the encoded prediction data is transmitted as a bit stream as shown in FIG. 3 to the decoding side via a recording medium 5 or a communication medium 6 such as a satellite line or a telephone line. On the decoding side, the first and second decoding units 3'-1 and 3'-2 constituting the decoding unit 3 'respectively perform 2ch "1" for the forward group, as shown in detail in FIG.
The prediction coded data of "2" and 4ch "3" to "6" relating to the other groups are decoded into PCM data for each channel. Next, the original 6 ch (Lf, C, Rf,
Ls, Rs, Lfe) and restore stereo 2
The ch data (L, R) is output as it is.

【0012】図2を参照して符号化部2’−1、2’−
2について詳しく説明する。各ch「1」〜「6」のPC
Mデータは1フレーム毎に1フレームバッファ10に格
納される。そして、1フレームの各ch「1」〜「6」の
サンプルデータがそれぞれ予測回路13D1、13D
2、15D1〜15D4に印加されるとともに、各ch
「1」〜「6」の各フレームの先頭サンプルデータ(後
述のリスタートヘッダ内に格納される)がアンパッキン
グ回路8及びフォーマット化回路19に印加される。ま
た、PCMデータがA/D変換されたときのサンプリン
グ周波数(fs)と量子化ビット数(Qb)がパッキン
グ回路18及びフォーマット化回路19に印加される。
予測回路13D1、13D2、15D1〜15D4はそ
れぞれ、各ch「1」〜「6」のPCMデータに対して、
特性が異なる複数の予測器(不図示)により時間領域に
おける過去の信号から現在の信号の複数の線形予測値を
算出し、次いで原PCMデータと、この複数の線形予測
値から予測器毎の予測残差を算出する。続くバッファ・
選択器14D1、14D2、16D1〜16D4はそれ
ぞれ、予測回路13D1、13D2、15D1〜15D
4により算出された各予測残差を一時記憶して、選択信
号/DTS(デコーディング・タイム・スタンプ)生成
器17により指定されたサブフレーム毎に予測残差の最
小値を選択する。
Referring to FIG. 2, encoding sections 2'-1, 2'-
2 will be described in detail. PC for each channel "1" to "6"
The M data is stored in one frame buffer 10 for each frame. Then, the sample data of each of the channels “1” to “6” of one frame are respectively supplied to the prediction circuits 13D1 and 13D.
2, 15D1 to 15D4 and each channel
First sample data (stored in a restart header described later) of each frame of “1” to “6” is applied to the unpacking circuit 8 and the formatting circuit 19. The sampling frequency (fs) and the number of quantization bits (Qb) when the PCM data is A / D converted are applied to the packing circuit 18 and the formatting circuit 19.
The prediction circuits 13D1, 13D2, and 15D1 to 15D4 respectively calculate the PCM data of each channel “1” to “6”.
A plurality of predictors (not shown) having different characteristics calculate a plurality of linear prediction values of the current signal from a past signal in the time domain, and then perform prediction for each predictor from the original PCM data and the plurality of linear prediction values. Calculate the residual. The following buffer
The selectors 14D1, 14D2, 16D1 to 16D4 are prediction circuits 13D1, 13D2, 15D1 to 15D, respectively.
4 is temporarily stored, and the minimum value of the prediction residual is selected for each subframe specified by the selection signal / DTS (decoding time stamp) generator 17.

【0013】選択信号生成器17は予測残差のビット数
フラグをパッキング回路18とフォーマット化回路19
に対して印加し、また、予測残差が最小の予測器を示す
予測器選択フラグと、後述するような相関係数をフォー
マット化回路19に対して印加する。パッキング回路1
8はバッファ・選択器14D1、14D2、16D1〜
16D4により選択された6ch分の予測残差を、選択信
号生成器17により指定されたビット数フラグに基づい
て指定ビット数でパッキングする。
The selection signal generator 17 outputs a bit number flag of the prediction residual to a packing circuit 18 and a formatting circuit 19.
, And a predictor selection flag indicating the predictor with the smallest prediction residual and a correlation coefficient as described later are applied to the formatting circuit 19. Packing circuit 1
8 is a buffer / selector 14D1, 14D2, 16D1.
The prediction residual for 6 ch selected by 16D4 is packed with the specified number of bits based on the bit number flag specified by the selection signal generator 17.

【0014】続くフォーマット化回路19は図3に示す
ようなユーザデータにフォーマット化する。このユーザ
データは前方グループに関する2ch(1)、(2)の予
測符号化データを含む可変レートビットストリームBS
0と、他のグループに関する4ch(3)〜(6)の予測
符号化データを含む可変レートビットストリームBS1
と、ストリームBS0、BS1の前に設けられたビット
ストリームヘッダにより構成されている。また、1フレ
ーム分のストリームBS0、BS1は ・フレームヘッダと、 ・各ch(1)〜(6)の1フレームの先頭サンプルデー
タと、 ・各ch(1)〜(6)のサブフレーム毎の予測器選択フ
ラグと、 ・各ch(1)〜(6)のサブフレーム毎のビット数フラ
グと、 ・各ch(1)〜(6)の予測残差データ列(可変ビット
数)と、 ・後述する相関係数 が多重化されている。このような予測符号化によれば、
原信号が例えばサンプリング周波数=96kHz、量子
化ビット数=24ビット、6チャネルの場合、71%の
圧縮率を実現することができる。
The following formatting circuit 19 formats the data into user data as shown in FIG. This user data is a variable rate bit stream BS including 2ch (1) and (2) prediction coded data for the front group.
0 and the variable rate bit stream BS1 including the prediction coded data of 4ch (3) to (6) regarding other groups.
And a bit stream header provided before the streams BS0 and BS1. The streams BS0 and BS1 for one frame include: a frame header; first sample data of one frame of each channel (1) to (6); and each subframe of each channel (1) to (6). A predictor selection flag; a bit number flag for each subframe of each channel (1) to (6); a prediction residual data sequence (variable number of bits) for each channel (1) to (6); The correlation coefficient described later is multiplexed. According to such predictive coding,
When the original signal has, for example, a sampling frequency of 96 kHz, the number of quantization bits = 24 bits, and six channels, a compression ratio of 71% can be realized.

【0015】次に図4を参照して復号化部3’−1、
3’−2について説明する。上記フォーマットの可変レ
ートビットストリームデータBS0、BS1は、デフォ
ーマット化回路21によりストリームデータとフレーム
ヘッダに基づいて分離される。そして、各ch「1」〜
「6」の1フレームの先頭サンプルデータと予測器選択
フラグはそれぞれ予測回路24D1、24D2、23D
1〜23D4に印加され、各ch「1」〜「6」のビッ
ト数フラグと予測残差データ列はアンパッキング回路2
2に印加される。ここで、予測回路24D1、24D
2、23D1〜23D4内の複数の予測器(不図示)は
それぞれ、符号化側の予測回路13D1、13D2、1
5D1〜15D4内の複数の予測器と同一の特性であ
り、予測器選択フラグにより同一特性のものが選択され
る。
Next, referring to FIG. 4, the decoding units 3'-1,
3′-2 will be described. The variable-rate bit stream data BS0 and BS1 in the above format are separated by the deformatting circuit 21 based on the stream data and the frame header. And each channel "1" ~
The head sample data of one frame of “6” and the predictor selection flag are stored in the prediction circuits 24D1, 24D2, and 23D, respectively.
1 to 23D4, and the bit number flags of each channel “1” to “6” and the prediction residual data sequence are stored in the unpacking circuit 2
2 is applied. Here, the prediction circuits 24D1, 24D
2, a plurality of predictors (not shown) in 23D1 to 23D4 are prediction circuits 13D1, 13D2, and 1 on the encoding side, respectively.
The characteristics are the same as those of the plurality of predictors in 5D1 to 15D4, and those having the same characteristics are selected by the predictor selection flag.

【0016】アンパッキング回路22は各ch「1」〜
「6」の予測残差データ列をビット数フラグ毎に基づい
て分離してそれぞれ予測回路24D1、24D2、23
D1〜23D4に出力する。予測回路24D1、24D
2、23D1〜23D4ではそれぞれ、アンパッキング
回路22からの各ch「1」〜「6」の今回の予測残差
データと、内部の複数の予測器の内、予測器選択フラグ
により選択された各1つにより予測された前回の予測値
が加算されて今回の予測値が算出され、次いで1フレー
ムの先頭サンプルデータを基準として各サンプルのPC
Mデータが算出される。
The unpacking circuit 22 is provided for each channel "1" to
The prediction residual data string of “6” is separated based on each bit number flag, and is divided into prediction circuits 24D1, 24D2, and 23, respectively.
It outputs to D1-23D4. Prediction circuits 24D1, 24D
2, 23D1 to 23D4, the current prediction residual data of each of the channels “1” to “6” from the unpacking circuit 22 and each of the plurality of internal predictors selected by the predictor selection flag. The previous predicted value predicted by one frame is added to calculate the current predicted value, and then the PC of each sample is determined based on the first sample data of one frame.
M data is calculated.

【0017】ここで、図2に示す符号化部2’−1、
2’−2により予測符号化された可変レートビットスト
リームデータを、記録媒体の一例としてDVDオーディ
オディスクに記録する場合には、図5に示すオーディオ
(A)パックにパッキングされる。このパックは203
4バイトのユーザデータ(Aパケット、Vパケット)に
対して4バイトのパックスタート情報と、6バイトのS
CR(System Clock Reference:システム時刻基準参照
値)情報と、3バイトのMux レート(rate)情報と1バ
イトのスタッフィングの合計14バイトのパックヘッダ
が付加されて構成されている(1パック=合計2048
バイト)。この場合、タイムスタンプであるSCR情報
を、ACBユニット内の先頭パックでは「1」として同
一タイトル内で連続とすることにより同一タイトル内の
Aパックの時間を管理することができる。
Here, the coding units 2'-1 shown in FIG.
When recording the variable-rate bit stream data predictively encoded by 2′-2 on a DVD audio disc as an example of a recording medium, the data is packed in an audio (A) pack shown in FIG. This pack is 203
For 4 bytes of user data (A packet, V packet), 4 bytes of pack start information and 6 bytes of S
It is configured by adding a 14-byte pack header of CR (System Clock Reference: system time reference value) information, 3-byte Mux rate (rate) information, and 1-byte stuffing (1 pack = 2048 total).
Part-Time Job). In this case, the time of the A pack in the same title can be managed by setting the SCR information as the time stamp to be “1” in the first pack in the ACB unit so as to be continuous in the same title.

【0018】圧縮PCMのAパケットは図6に詳しく示
すように、9〜22バイトのパケットヘッダと、圧縮P
CMのプライベートヘッダと、図3に示すフォーマット
の1ないし2015バイトのオーディオデータ(圧縮P
CM)により構成されている。圧縮PCMのプライベー
トヘッダは、 ・1バイトのサブストリームIDと、 ・2バイトのUPC/EAN−ISRC(Universal Pr
oduct Code/European Article Number-International S
tandard Recording Code)番号、及びUPC/EAN−
ISRCデータと、 ・1バイトのプライベートヘッダ長と、 ・2バイトの第1アクセスユニットポインタと、 ・4バイトのオーディオデータ情報(ADI)と、 ・0〜7バイトのスタッフィングバイトとに、 より構成されている。
The A packet of the compressed PCM has a packet header of 9 to 22 bytes and a compressed P
The CM private header and 1 to 2015 bytes of audio data (compressed P
CM). The private header of the compressed PCM is: 1-byte substream ID, 2 bytes of UPC / EAN-ISRC (Universal Prism).
oduct Code / European Article Number-International S
tandard Recording Code) number and UPC / EAN-
ISRC data, 1-byte private header length, 2-byte first access unit pointer, 4-byte audio data information (ADI), and 0-7 byte stuffing bytes. ing.

【0019】そして、ADI内に1秒後のアクセスユニ
ットをサーチするための前方アクセスユニット・サーチ
ポインタと、1秒前のアクセスユニットをサーチするた
めの後方アクセスユニット・サーチポインタがともに1
バイトでセットされる。具体的には、ADIの1バイト
目に前方アクセスユニット・サーチポインタが、8バイ
ト目に後方アクセスユニット・サーチポインタがセット
される。このようにADIは、圧縮PCMでは4バイト
に減少させるためオーディオデータを2015バイトま
で収納できる。
The forward access unit search pointer for searching for the access unit one second later and the backward access unit search pointer for searching for the access unit one second earlier in the ADI are both 1
Set in bytes. Specifically, the forward access unit search pointer is set in the first byte of the ADI, and the backward access unit search pointer is set in the eighth byte. Thus, ADI can store up to 2015 bytes of audio data in order to reduce it to 4 bytes in compressed PCM.

【0020】図6に示す圧縮PCM(PPCM)のオー
ディオパケットにおけるオーディオデータエリアは、図
7に示すように複数のPPCMアクセスユニットにより
構成され、PPCMアクセスユニットはPPCMシンク
情報とサブパケットにより構成されている。最初のPP
CMアクセスユニット内のサブパケットは、ディレクト
リと、サブストリーム「BS0」と、CRC(1バイト
又は2バイト)と、サブストリーム「BS1」と、CR
Cとエクストラ情報により構成され、サブストリーム
「BS0」、「BS1」はPPCMブロックのみにより
構成されている。2番目以降のPPCMアクセスユニッ
ト内のサブパケットも、ディレクトリと、サブストリー
ム「BS0」と、CRCと、サブストリーム「BS1」
と、CRCとエクストラ情報により構成され、サブスト
リーム「BS0」、「BS1」はリスタートヘッダとP
PCMブロックにより構成されている。
The audio data area in the compressed PCM (PPCM) audio packet shown in FIG. 6 is composed of a plurality of PPCM access units as shown in FIG. 7, and the PPCM access unit is composed of PPCM sync information and sub-packets. I have. First PP
The subpacket in the CM access unit includes a directory, a substream “BS0”, a CRC (1 byte or 2 bytes), a substream “BS1”,
C and extra information, and the sub-streams “BS0” and “BS1” are composed of only PPCM blocks. Sub-packets in the second and subsequent PPCM access units also include a directory, a sub-stream “BS0”, a CRC, and a sub-stream “BS1”.
, CRC and extra information, and the sub-streams “BS0” and “BS1” have a restart header and P
It is composed of PCM blocks.

【0021】また、図2に示す符号化部2’−1、2’
−2により予測符号化された可変レートビットストリー
ムデータをネットワークを介して伝送する場合には、符
号化側では図8示すように伝送用にパケット化し(ステ
ップS41)、次いでパケットヘッダを付与し(ステッ
プS42)、次いでこのパケットをネットワーク上に送
り出す(ステップS43)。復号側では図9に示すよう
にヘッダを除去し(ステップS51)、次いでデータを
復元し(ステップS52)、次いでこのデータをメモリ
に格納して復号を待つ(ステップS53)。
The encoding units 2'-1, 2 'shown in FIG.
When the variable rate bit stream data predicted and coded according to -2 is transmitted through a network, the coding side packetizes the data for transmission as shown in FIG. 8 (step S41), and then attaches a packet header (step S41). (Step S42) Then, the packet is sent out onto the network (Step S43). On the decoding side, the header is removed as shown in FIG. 9 (step S51), the data is restored (step S52), and the data is stored in a memory and decoding is waited (step S53).

【0022】なお、上記実施形態では、ステレオ2chデ
ータ(L、R)をそのまま伝送したが、 「1」=L+R 「2」=L−R 「3」〜「5」は同じ 「6」=Lfe−a×C ただし、0≦a≦1 …(2)’ により6チャネル「1」〜「6」と共に、相関のある信
号に変換して予測符号化するようにしてもよい(第2の
実施形態)。この場合には、復号化側のミクス&マトリ
クス回路4’はチャネル「1」、「2」を加算すること
によりチャネルLを、減算することによりチャネルRを
生成することができる。なお、上記実施例では、マルチ
チャンネル(6ch)とステレオ(2ch)と復元する
ようにしているが、いずれか一方でもよいことは言うま
でもない。
In the above embodiment, the stereo 2ch data (L, R) is transmitted as it is, but “1” = L + R “2” = LR “3” to “5” are the same “6” = Lfe −a × C However, 0 ≦ a ≦ 1... (2) ′ may be converted into a correlated signal together with the six channels “1” to “6” for predictive coding (second embodiment). Form). In this case, the mix & matrix circuit 4 ′ on the decoding side can generate the channel L by adding the channels “1” and “2”, and generate the channel R by subtracting the channel L. In the above embodiment, the multi-channel (6ch) and the stereo (2ch) are restored, but it goes without saying that either one may be restored.

【0023】また、図10は第3の実施の形態を示す図
で、この場合にはダウンミックスすることなく、前方グ
ループに関する2ch「1」、「2」を 「1」=Lf+Rf 「2」=Lf−Rf として伝送する。そして、再生側では、所望に応じて後
段側のミックス&マトリクス回路4’から出力されたダ
ウンミックスされない信号Lf,Rfをステレオ2チャ
ンネルとして使用したり、この回路4’内でダウンミッ
クスされて取り出されたステレオ2チャンネル信号L,
Rを使用することもできる。
FIG. 10 is a diagram showing the third embodiment. In this case, without downmixing, 2ch “1” and “2” for the front group are changed to “1” = Lf + Rf “2” = It is transmitted as Lf-Rf. Then, on the reproduction side, the signals Lf and Rf which are not downmixed and output from the subsequent mix & matrix circuit 4 'are used as two stereo channels as required, or are downmixed and taken out in this circuit 4'. Stereo 2-channel signal L,
R can also be used.

【0024】次に図11、図12、図13を参照して第
4の実施形態について説明する。上記の実施形態では、
1グループの相関性の信号「1」〜「6」を予測符号化
するように構成されているが、この第4の実施形態では
複数グループの相関性のある信号を生成して予測符号化
し、圧縮率が最も高いグループの予測符号化データを選
択するように構成されている。また、この実施例ではそ
の1グループ内における符号化は、前述の各実施例の場
合のように前方グループに関する2chと他のグループ
に関する4chに分類して変換するようなことはせず
に、一つにまとめた符号化処理が行われる構成で、図1
1は前述の図1に対応した図として示してある。また、
図12は符号化部の詳細ブロックを示すものであるが、
本実施例の場合にはn個の相関回路1−1〜1−nまで
が、ミクス&マトリクス回路1’側に設けられている。
これらn個の相関回路1−1〜1−nは例えば6ch(L
f、C、Rf、Ls、Rs、Lfe)のPCMデータ
を、相関性が異なるn種類の6ch信号「1」〜「6」に
変換する。
Next, a fourth embodiment will be described with reference to FIG. 11, FIG. 12, and FIG. In the above embodiment,
Although one group of correlated signals “1” to “6” are configured to be predictively coded, in the fourth embodiment, a plurality of groups of correlated signals are generated and predicted and coded. It is configured to select the prediction coded data of the group having the highest compression ratio. Further, in this embodiment, the encoding in one group is not classified and converted into 2ch for the front group and 4ch for the other group as in each of the above-described embodiments. FIG. 1 shows a configuration in which the combined encoding process is performed.
Reference numeral 1 denotes a diagram corresponding to FIG. Also,
FIG. 12 shows a detailed block of the encoding unit.
In this embodiment, n correlation circuits 1-1 to 1-n are provided on the mix & matrix circuit 1 'side.
These n correlation circuits 1-1 to 1-n are, for example, 6 ch (L
f, C, Rf, Ls, Rs, Lfe) are converted into n types of 6-channel signals “1” to “6” having different correlations.

【0025】例えば第1の相関回路1−1は以下のよう
に変換し、 「1」=Lf 「2」=C−(Ls+Rs)/2 「3」=Rf−Lf 「4」=Ls−a×Lfe 「5」=Rs−b×Rf 「6」=Lfe また、第nの相関回路1−nは以下のように変換し、 「1」=Lf+Rf 「2」=C−Lf 「3」=Rf−Lf 「4」=Ls−Lf 「5」=Rs−Lf 「6」=Lfe−C また、他の相関回路は第1の実施形態のように変換す
る。
For example, the first correlation circuit 1-1 converts as follows: "1" = Lf "2" = C- (Ls + Rs) / 2 "3" = Rf-Lf "4" = Ls-a × Lfe “5” = Rs−b × Rf “6” = Lfe Further, the n-th correlation circuit 1-n converts as follows: “1” = Lf + Rf “2” = C−Lf “3” = Rf−Lf “4” = Ls−Lf “5” = Rs−Lf “6” = Lfe−C Further, other correlation circuits perform conversion as in the first embodiment.

【0026】また、相関回路1−1〜1−n毎に予測回
路15とバッファ・選択器16が設けられ、グループ毎
の予測残差の最小値のデータ量に基づいて圧縮率が最も
高いグループが相関選択信号生成器17bにより選択さ
れる。このとき、フォーマット化回路19はその選択フ
ラグ(相関回路選択フラグ、その相関回路の相関係数
a、b)を追加して多重化する。
Further, a prediction circuit 15 and a buffer / selector 16 are provided for each of the correlation circuits 1-1 to 1-n, and the group having the highest compression ratio is determined based on the data amount of the minimum value of the prediction residual for each group. Are selected by the correlation selection signal generator 17b. At this time, the formatting circuit 19 adds and multiplexes the selection flag (correlation circuit selection flag, correlation coefficients a and b of the correlation circuit).

【0027】そして、図13は前述の図6に対応したデ
ータエリアを示し、この実施例ではサブストリーム「B
S1」を用いず、サブストリーム「BS0」のみで構成
することになる。
FIG. 13 shows a data area corresponding to FIG. 6 described above.
Instead of using “S1”, the sub-stream “BS0” alone is used.

【0028】また、図14に示す復号化側では、符号化
側の相関回路1−1〜1−nに対してn個の相関回路4
−1〜4−n(又は係数a、bが変更可能な1つの相関
回路4)が設けられる。なお、図12に示すnグループ
の予測回路が同一の構成である場合、復号装置では図1
4に示すようにnグループ分の予測回路を設ける必要は
なく、1つのグループ分の予測回路でよい。そして、符
号化装置から伝送された選択フラグに基づいて相関回路
4−1〜4−nの1つを選択、又は係数a、bを設定し
て元の6ch(Lf、C、Rf、Ls、Rs、Lfe)を
復元し、また、式(1)によりマルチチャネルをダウン
ミクスしてステレオ2chデータ(L、R)を生成する。
また、チャンネル数が「1」〜「6」の6チャンネル方
式のものは、一例であって5チャンネル方式等他の方式
のものであってもよい。
Further, on the decoding side shown in FIG. 14, n correlation circuits 4 are provided for the correlation circuits 1-1 to 1-n on the encoding side.
−1 to 4-n (or one correlation circuit 4 whose coefficients a and b can be changed) are provided. Note that when the prediction circuits of the n groups shown in FIG. 12 have the same configuration,
As shown in FIG. 4, there is no need to provide prediction circuits for n groups, and prediction circuits for one group are sufficient. Then, one of the correlation circuits 4-1 to 4-n is selected based on the selection flag transmitted from the encoding device, or coefficients a and b are set and the original 6 ch (Lf, C, Rf, Ls, Rs, Lfe) are restored, and the multi-channel is downmixed according to equation (1) to generate stereo 2-ch data (L, R).
Further, the 6-channel system having the number of channels “1” to “6” is an example, and another system such as a 5-channel system may be used.

【0029】また、上記の第1の実施形態では、1種類
の相関性の信号「1」〜「6」を予測符号化するように
構成されているが、この信号「1」〜「6」のグループ
と原信号(Lf、C、Rf、Ls、Rs、Lfe)のグ
ループを予測符号化し、圧縮率が高い方のグループを選
択するようにしてもよい。
In the first embodiment, one kind of correlation signal "1" to "6" is configured to be predictively coded. However, the signals "1" to "6" are encoded. And the group of the original signals (Lf, C, Rf, Ls, Rs, Lfe) may be predictively coded and the group with the higher compression ratio may be selected.

【0030】[0030]

【発明の効果】以上説明したように本発明によれば、元
のマルチチャネルの音声信号をステレオ2チャネルの音
声信号に変換すると共に、得られたステレオ2チャネル
を含む第1のグループと他のチャネルを含む第2のグル
ープに分類して、少なくとも前記第2のグループのチャ
ネルの音声信号を相関性のある音声信号に変換して各チ
ャネルを予測符号化するようにしたので、マルチチャネ
ルの音声信号を予測符号化する場合に圧縮率を改善する
ことができるとともに、第1のグループのみを用いて復
号してステレオ2チャンネルを再生することができる。
As described above, according to the present invention, the original multi-channel audio signal is converted into a stereo two-channel audio signal, and the obtained first group including the stereo two channels and other two-channel audio signals are converted. Since the channels are classified into a second group including channels, and at least the audio signals of the channels of the second group are converted into correlated audio signals to predictively encode each channel, multi-channel audio is obtained. The compression rate can be improved when a signal is predictively coded, and two stereo channels can be reproduced by decoding using only the first group.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明に係る音声符号化装置及び音声復号装置
の第1の実施形態を示すブロック図である。
FIG. 1 is a block diagram illustrating a first embodiment of a speech encoding device and a speech decoding device according to the present invention.

【図2】図1の符号化部を詳しく示すブロック図であ
る。
FIG. 2 is a block diagram illustrating an encoding unit of FIG. 1 in detail.

【図3】図1、図2の符号化部により符号化されたビッ
トストリームを示す説明図である。
FIG. 3 is an explanatory diagram showing a bit stream encoded by an encoding unit shown in FIGS. 1 and 2;

【図4】図1の復号化部を詳しく示すブロック図であ
る。
FIG. 4 is a block diagram illustrating a decoding unit of FIG. 1 in detail;

【図5】DVDのパックのフォーマットを示す説明図で
ある。
FIG. 5 is an explanatory diagram showing a format of a DVD pack.

【図6】DVDのオーディオパックのフォーマットを示
す説明図である。
FIG. 6 is an explanatory diagram showing a format of a DVD audio pack.

【図7】図6のオーディオデータエリアのフォーマット
を詳しく示す説明図である。
FIG. 7 is an explanatory diagram showing a format of an audio data area in FIG. 6 in detail;

【図8】音声伝送方法を示すフローチャートである。FIG. 8 is a flowchart showing a voice transmission method.

【図9】音声伝送方法を示すフローチャートである。FIG. 9 is a flowchart showing a voice transmission method.

【図10】第3の実施形態の音声符号化装置及び音声復
号装置を示すブロック図である。
FIG. 10 is a block diagram illustrating a speech encoding device and a speech decoding device according to a third embodiment.

【図11】本発明に係る音声符号化装置及び音声復号装
置の第4の実施形態を示すブロック図である。
FIG. 11 is a block diagram showing a fourth embodiment of the speech encoding device and the speech decoding device according to the present invention.

【図12】第4の実施形態の音声符号化装置を示すブロ
ック図である。
FIG. 12 is a block diagram illustrating a speech encoding device according to a fourth embodiment.

【図13】図7に対応した別の実施例の説明図である。FIG. 13 is an explanatory diagram of another embodiment corresponding to FIG. 7;

【図14】第4の実施形態の音声復号装置を示すブロッ
ク図である。
FIG. 14 is a block diagram illustrating a speech decoding device according to a fourth embodiment.

【符号の説明】[Explanation of symbols]

1’ 6chミクス&マトリクス回路(相関手段、ダウン
ミクス手段) 13D1、13D2、15D1〜15D4 予測回路
(バッファ・選択器14D1、14D2、16D1〜1
6D4と共に予測符号化手段を構成する。) 14D1、14D2、16D1〜16D4 バッファ・
選択器 19 フォーマット化回路(フォーマット化手段)
1 '6ch mix & matrix circuit (correlation means, downmix means) 13D1, 13D2, 15D1-15D4 Prediction circuit (buffer / selector 14D1, 14D2, 16D1-1)
Together with 6D4, it constitutes a predictive coding means. 14D1, 14D2, 16D1-16D4 buffer
Selector 19 Formatting circuit (Formatting means)


RetroSearch is an open source project built by @garambo | Open a GitHub Issue

Search and Browse the WWW like it's 1997 | Search results from DuckDuckGo

HTML: 3.2 | Encoding: UTF-8 | Version: 0.7.4