A RetroSearch Logo

Home - News ( United States | United Kingdom | Italy | Germany ) - Football scores

Search Query:

Showing content from https://patents.google.com/patent/JP2003233395A/en below:

JP2003233395A - Method and device for encoding audio signal and encoding and decoding system

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、例えばATRAC
3のような利得制御方法を採用する符号化方法に適用さ
れる、オーディオ信号の符号化方法及び装置、並びに符
号化及び復号化システムに関し、特に、急激な立上がり
信号であるアタック信号の前に発生するプリエコー雑音
と、急激な立下がり信号であるリリース信号の後に発生
するポストエコー雑音とを抑圧するためのオーディオ信
号の符号化方法及び装置、並びに符号化及び復号化シス
テムに関する。
TECHNICAL FIELD The present invention relates to, for example, ATRAC.
The present invention relates to an audio signal encoding method and apparatus and an encoding and decoding system applied to an encoding method adopting a gain control method such as No. 3, and particularly to an audio signal which occurs before an attack signal which is a sharp rising signal. The present invention relates to an audio signal encoding method and apparatus, and an encoding and decoding system for suppressing pre-echo noise and post-echo noise generated after a release signal which is a sharp falling signal.

【0002】[0002]

【従来の技術】プリエコー雑音及びポストエコー雑音に
関する古典的な問題は、オーディオ信号の変換符号化に
おいて公知である(例えば、特開2000−25919
7号公報参照。)。図19(a)は利得制御をせず、プ
リエコーやポストエコーが発生するときの従来技術のオ
ーディオ信号の符号化及び復号化装置の構成を示すブロ
ック図であり、図19(b)は利得制御を行い、プリエ
コーやポストエコーを抑圧するときの従来技術のオーデ
ィオ信号の符号化及び復号化装置の構成を示すブロック
図である。
BACKGROUND OF THE INVENTION The classical problem of pre-echo noise and post-echo noise is well known in transform coding of audio signals (e.g. JP 2000-25919 A).
See Publication No. 7. ). FIG. 19 (a) is a block diagram showing the configuration of a conventional audio signal encoding / decoding apparatus when pre-echo and post-echo occur without gain control, and FIG. 19 (b) shows gain control. FIG. 3 is a block diagram showing a configuration of a conventional audio signal encoding / decoding device when performing pre-echo and post-echo.

【0003】図19(a)に図示された、変形離散コサ
イン変換(以下、MDCTという。)処理部101及び
量子化器102を備えた符号化器と、逆量子化器103
及び逆MDCT処理部104を備えた復号化器とを参照
すると、アタック信号(すなわち、急激な音の立上がり
を含む信号)を含む典型的な変換ブロックが符号化器に
入力されるとき、量子化器102は雑音を導入し、次い
で、復号化器は復元されたブロックにおいて上記雑音を
時間領域について均等に分布させる。すなわち、復元さ
れた変換ブロック内にプリエコー雑音とポストエコー雑
音が発生する現象は、内部にアタック信号を含む変換ブ
ロック上に、アタック信号を量子化することによって発
生する量子化雑音を均等に分布させることによって引き
起こされる。アタック信号は、信号の強度の急激な増大
の前に、小さい振幅の期間が存在し、それらすべてが変
換ブロック内に存在するということによって特徴づけら
れる。また一般に、信号は急激なサージに続いて短時間
でテーパ状に振幅が小さくなるが、信号のこの急激な音
の立下がりを含む部分はリリース信号と呼ばれ、リリー
ス信号もまた、アタック信号と同様に、プリエコー雑音
とポストエコー雑音を発生させる。
An encoder having a modified discrete cosine transform (hereinafter referred to as MDCT) processing unit 101 and a quantizer 102 shown in FIG. 19A, and an inverse quantizer 103.
And a decoder including the inverse MDCT processing unit 104, quantization when a typical transform block including an attack signal (that is, a signal including a sharp rise of a sound) is input to the encoder. The unit 102 introduces noise, and the decoder then distributes the noise evenly in the time domain in the reconstructed block. In other words, the phenomenon in which pre-echo noise and post-echo noise occur in the restored transform block is that the quantization noise generated by quantizing the attack signal is evenly distributed on the transform block containing the attack signal inside. Caused by. The attack signal is characterized by the presence of periods of small amplitude, all within the transform block, before the sudden increase in signal strength. In general, a signal decreases in amplitude in a taper shape in a short time following a sudden surge, but the part of the signal including this sharp fall of the sound is called a release signal, and the release signal is also called an attack signal. Similarly, pre-echo noise and post-echo noise are generated.

【0004】プリエコーは、次の2つの理由によって、
聴覚的に、ポストエコーよりも耳障りである。第1に、
プリエコーは、大きな強度のアタック信号の部分の下に
隠れてしまいがちなポストエコーとは異なり、その大き
さが、重畳する小さな振幅の信号をはるかに超過してい
る。第2に、人間の耳では、マスキングされる音がアタ
ック信号の部分の時間的後方に存在する順方向マスキン
グ継続時間と比較して、マスキングされる音がアタック
信号の部分の時間的前方に存在する逆方向マスキング継
続時間が、はるかに短いという特徴を有する。具体的に
は、順方向マスキング継続時間は約200msecであ
り、逆方向マスキング継続時間は約5msecである。
Pre-echo is due to the following two reasons.
Hearingly, it is more annoying than post-echo. First,
The pre-echo, unlike the post-echo, which tends to be hidden under the portion of the attack signal of high intensity, is much larger in magnitude than the superimposed small amplitude signal. Second, in the human ear, the masked sound is ahead of the attack signal portion in time compared to the forward masking duration where the masked sound is behind the attack signal portion in time. The reverse masking duration is significantly shorter. Specifically, the forward masking duration is about 200 msec and the backward masking duration is about 5 msec.

【0005】この問題を扱うために、以下のような3つ
の公知の方法が存在する。 (a)ブロックサイズ切り換え法 (b)時間方向の雑音波形整形法 (c)利得制御法
There are three known methods for dealing with this problem: (A) Block size switching method (b) Time direction noise waveform shaping method (c) Gain control method

【0006】ブロックサイズ切り換え法は、通常の変換
ブロックをより短い部分ブロックに分割し、各部分ブロ
ックに対してより短い変換を適用する。このことは、プ
リエコー雑音の拡散を、短い部分ブロック内に包含させ
ることを援助する。時間方向の雑音波形整形法は、アタ
ック信号が時間領域におけるその非均一性によって特徴
付けられているので、スペクトルデータに予測符号化を
適用することによって、時間−周波数の双対性を利用す
る。最後に、利得制御法は、修正関数(MF)を用い
て、小さい振幅の部分の信号強度を増幅することによっ
て、及び/又は大きい振幅の部分の信号強度を抑制する
ことによって、時間領域における信号を修正する(利得
制御する)。
The block size switching method divides a normal transform block into shorter sub-blocks and applies a shorter transform to each sub-block. This helps to include the pre-echo noise spread within the short sub-blocks. The temporal noise shaping method exploits the time-frequency duality by applying predictive coding to the spectral data, since the attack signal is characterized by its non-uniformity in the time domain. Finally, the gain control method uses a modification function (MF) to amplify the signal strength of the small amplitude portion and / or suppress the signal strength of the large amplitude portion to obtain a signal in the time domain. Is corrected (gain control).

【0007】従来技術に係る利得制御法の1つの例が図
19(b)に図示されている。ここでは、図19(a)
の符号化器及び復号化器に対して、さらに利得制御部1
05と逆利得制御部106が設けられている。図19
(a)と同様のアタック信号を含む変換ブロックが入力
されたとき、利得制御部105は弱い信号を増幅し、及
び/又は強い信号を抑圧する。この増幅及び/又は抑圧
の情報は、符号化された信号とともに復号化器に送ら
れ、上記情報に基づいて、逆利得制御部106は、利得
制御部105において増幅された部分を抑圧し、及び/
又は抑圧された部分を増幅する。量子化器102は雑音
を導入し、復元されたブロックにおいて上記雑音を時間
領域について均等に分布させるが、逆利得制御部106
の後段において、雑音は、図19(a)の利得制御なし
の例と比較すると、信号が予め小さな振幅だった領域に
おいて抑圧されていることがわかる。
One example of a gain control method according to the prior art is shown in FIG. 19 (b). Here, FIG. 19 (a)
Gain control unit 1 for the encoder and the decoder of
05 and an inverse gain control unit 106 are provided. FIG. 19
When a conversion block including an attack signal similar to that in (a) is input, the gain control unit 105 amplifies a weak signal and / or suppresses a strong signal. This amplification and / or suppression information is sent to the decoder together with the encoded signal, and based on the above information, the inverse gain control unit 106 suppresses the amplified part in the gain control unit 105, and /
Alternatively, the suppressed part is amplified. The quantizer 102 introduces noise and evenly distributes the noise in the restored block in the time domain, but the inverse gain controller 106
In the latter stage, it can be seen that the noise is suppressed in the region where the signal had a small amplitude in advance, as compared with the example without gain control in FIG.

【0008】[0008]

【発明が解決しようとする課題】プリエコー及びポスト
エコーの問題に取り組むための適正な方法では、新しい
要因を考慮する必要がある。アタック信号に先行する小
さい振幅の信号が、早すぎず、かつ遅すぎないように増
幅されるように、信号中のアタック信号の立上がりの開
始位置(オンセット)を捕捉することが重要である。信
号をあまり早く増幅すると、プリエコー及びポストエコ
ーは効果的に除去されない。信号をあまり遅く増幅する
と、アタック信号自体を増幅させる危険もあり、従っ
て、プリエコー問題をさらに悪化させる結果となる。ア
タック信号がプリエコー雑音の発生に関与するのと同様
に、リリース信号もまたプリエコー及びポストエコー雑
音の発生に関与するので、そのようなリリース信号の影
響もまた抑圧しなければならない。
Proper methods for addressing the pre-echo and post-echo problems require new factors to be considered. It is important to capture the onset of the rising edge of the attack signal in the signal so that the small amplitude signal preceding the attack signal is amplified not too early and not too late. If the signal is amplified too quickly, the pre-echo and post-echo will not be effectively removed. Amplifying the signal too slowly also carries the risk of amplifying the attack signal itself, thus resulting in aggravating the pre-echo problem. Since the release signal also contributes to the generation of pre-echo and post-echo noise, just as the attack signal contributes to the generation of pre-echo noise, the effect of such release signal must also be suppressed.

【0009】同様に、信号エネルギーの増大(サージ)
が後に続くスペクトル量子化の処理に過度の負担をかけ
ないように、小さい振幅の信号を増幅した結果としての
信号強度の増大は、大きい振幅の信号を適当な程度に減
衰することによってバランスをとる必要がある。減衰さ
れた信号の、復号化器で回復される際の正確さを減少さ
せないように、減衰は過度であってはならない。最悪の
場合、過度の減衰は、われわれが除去しようとするポス
トエコーよりも耳障りな、付加的な人工物(アーティフ
ァクト)を導入することがある。ゆえに、減衰が適用さ
れるべき範囲を設定するための方法も同様に重要であ
る。
Similarly, an increase in signal energy (surge)
The increase in signal strength as a result of amplifying the small amplitude signal is balanced by attenuating the large amplitude signal to an appropriate degree, so as not to unduly burden the processing of the subsequent spectral quantization. There is a need. The attenuation should not be excessive so as not to reduce the accuracy of the attenuated signal as it is recovered at the decoder. In the worst case, excessive attenuation can introduce additional artifacts that are less annoying than the post-echo we are trying to remove. Therefore, the method for setting the range to which the damping should be applied is also important.

【0010】最後に、適正な利得制御方法は、アタック
信号とリリース信号を豊富に含むことによって特徴付け
られる、発話音声のような信号に適応するものである必
要がある。これは、このような信号が、過度の増幅及び
過度の減衰によって導入されるアーティファクトに対し
て非常に影響を受けやすいからである。これらのアタッ
ク及びリリースは、遷移がさほど急激でない(すなわ
ち、より自然である)傾向があり、ゆえに、当該利得制
御方法は、信号強度におけるこれらの自然な遷移を検出
するとき、あまり急激でない利得制御に復帰する必要が
ある。
Finally, a proper gain control method needs to be adaptable to speech-like signals, which are characterized by abundant attack and release signals. This is because such signals are very susceptible to artifacts introduced by excessive amplification and excessive attenuation. These attacks and releases tend to have transitions that are less abrupt (ie, more natural), and therefore the gain control method is less aggressive when detecting these natural transitions in signal strength. Need to return to.

【0011】次に、上述の要因をすべて考慮に入れて、
利得制御を達成するために、修正関数を生成して、生成
した修正関数を上記フレームに対して乗算することがで
きる。この修正関数は、先行するサブバンドフレーム及
び現在のサブバンドフレームのサンプル信号をオーバー
フローさせるものであってはならない。
Next, taking all of the above factors into consideration,
A correction function may be generated and the generated correction function may be multiplied with the frame to achieve gain control. The correction function must not overflow the sampled signals of the preceding subband frame and the current subband frame.

【0012】本発明の目的は、以上の問題点を解決し、
修正関数をより正確に生成して利得制御を実行すること
により、プリエコー雑音及びポストエコー雑音を確実に
抑圧することができるオーディオ信号の符号化方法及び
装置、並びに符号化及び復号化システムを提供すること
にある。
An object of the present invention is to solve the above problems,
Provided are an audio signal encoding method and apparatus, and an encoding and decoding system capable of reliably suppressing pre-echo noise and post-echo noise by generating a correction function more accurately and performing gain control. Especially.

【0013】[0013]

【課題を解決するための手段】本発明の第1の態様に係
るオーディオ信号の符号化方法は、入力されたオーディ
オ信号に基づいてフレーム毎に修正関数を計算して、計
算された修正関数に従って上記オーディオ信号に対して
利得制御するステップと、上記利得制御されたオーディ
オ信号に対して、縦続接続された互いに隣接する2つの
フレーム毎に直交変換処理を行いかつ符号化処理を行う
ことにより符号化されたビットストリーム信号を得るス
テップとを含むオーディオ信号の符号化方法において、
上記利得制御するステップは、入力されたオーディオ信
号をフレームの時間よりも短い時間の複数の区分に分割
し、上記分割された各区分のピークの絶対値を計算する
ステップと、上記分割された区分を有するオーディオ信
号に基づいて、急激な音の立上がりを含む信号の部分で
あるアタック信号の開始位置を含む区分を修正ポイント
として識別するステップと、上記分割された区分を有す
るオーディオ信号に基づいて、急激な音の立下がりを含
む信号の部分であるリリース信号の終了位置を含む区分
を修正ポイントとして識別するステップと、上記分割さ
れた区分を有するオーディオ信号に基づいて、上記修正
関数に従って利得制御したときに所望される、処理すべ
き現在のフレームにおける目標ピーク値を計算するステ
ップと、上記識別されたアタック信号の開始位置を含む
区分と、上記識別されたリリース信号の終了位置を含む
区分と、上記計算された目標ピーク値とに基づいて、当
該現在のフレームの各区分に係る修正関数値からなる修
正関数を計算するステップとを含むことを特徴とする。
According to a first aspect of the present invention, an audio signal encoding method calculates a correction function for each frame based on an input audio signal, and according to the calculated correction function. Gain control of the audio signal, and encoding of the gain-controlled audio signal by performing an orthogonal transform process and an encoding process for every two adjacent frames that are connected in cascade. A method of encoding an audio signal, the method comprising:
The step of controlling the gain divides the input audio signal into a plurality of sections having a time shorter than the time of a frame, calculates the absolute value of the peak of each of the divided sections, and the divided section. Based on the audio signal having, the step of identifying a section including the start position of the attack signal, which is a part of the signal including a sharp rise of sound, as a correction point, and based on the audio signal having the divided section, The step of identifying the section including the end position of the release signal, which is the portion of the signal including the abrupt fall of the sound, as a correction point, and the gain control according to the correction function based on the audio signal having the divided section Calculating a target peak value in the current frame to be processed, which is sometimes desired; Based on the section including the start position of the attack signal, the section including the end position of the identified release signal, and the calculated target peak value, the correction function value for each section of the current frame Calculating a correction function consisting of

【0014】上記オーディオ信号の符号化方法におい
て、上記アタック信号の開始位置を含む区分を識別する
ステップは、処理すべき現在の区分に続く次の区分のピ
ークの絶対値と、当該現在の区分以前の予め決められた
数の区分に係る各ピークの絶対値との比に基づいて、当
該現在の区分がアタック信号の開始位置を含むか否かを
決定するステップと、当該現在の区分が上記アタック信
号の開始位置を含むと決定されたときは、アタック信号
の開始位置を含むことを示す所定の第1の値を当該現在
の区分に割り当てるステップとを含むことを特徴とす
る。
In the audio signal encoding method, the step of identifying the section including the start position of the attack signal includes the absolute value of the peak of the next section following the current section to be processed and the peak before the current section. A step of determining whether the current segment includes the start position of the attack signal based on a ratio with the absolute value of each peak related to the predetermined number of segments, and the current segment includes the attack. Assigning a predetermined first value indicating that the attack signal includes the start position to the current segment when it is determined to include the signal start position.

【0015】また、上記オーディオ信号の符号化方法に
おいて、上記リリース信号の終了位置を含む区分を識別
するステップは、処理すべき現在の区分と、当該現在の
区分に先行する修正ポイントとの間における最大のピー
クの絶対値と、当該現在の区分以後の予め決められた数
の区分に係る各ピークの絶対値との比に基づいて、当該
現在の区分がリリース信号の終了位置を含むか否かを決
定するステップと、当該現在の区分が上記リリース信号
の終了位置を含むと決定されたときは、リリース信号の
終了位置を含むことを示す所定の第2の値を当該現在の
区分に割り当てるステップとを含むことを特徴とする。
In the audio signal encoding method, the step of identifying a section including the end position of the release signal is between a current section to be processed and a correction point preceding the current section. Whether the current segment includes the end position of the release signal based on the ratio of the absolute value of the maximum peak to the absolute value of each peak in a predetermined number of segments after the current segment. And, if it is determined that the current segment includes the end position of the release signal, assigning a predetermined second value indicating the end position of the release signal to the current segment. It is characterized by including and.

【0016】さらに、上記オーディオ信号の符号化方法
において、上記目標ピーク値を計算するステップは、互
いに隣接する各1対の修正ポイント間の最大のピークの
絶対値と、上記割り当てられた第1の値及び第2の値
と、処理すべき現在のフレームに続く次のフレームの最
初の区分に係るピークの絶対値とに基づいて、当該処理
すべき現在のフレームのオーディオ信号を上記修正関数
に従って利得制御したときに所望される目標ピーク値を
計算することを特徴とする。
Further, in the audio signal encoding method, the step of calculating the target peak value includes the absolute value of the maximum peak between each pair of correction points adjacent to each other and the assigned first value. A gain of the audio signal of the current frame to be processed according to the correction function, based on the value and the second value and the absolute value of the peak of the first segment of the next frame following the current frame to be processed. It is characterized by calculating a desired target peak value when controlled.

【0017】またさらに、上記オーディオ信号の符号化
方法において、上記修正関数を計算するステップは、上
記アタック信号の開始位置を含む区分と、当該アタック
信号の開始位置を含む区分に先行する修正ポイントとの
間の各区分に係る修正関数値を、当該アタック信号の開
始位置を含む区分と、上記先行する修正ポイントとの間
における最大のピークの絶対値が、上記目標ピーク値に
等しくなるように計算し、上記リリース信号の開始位置
を含む区分と、当該リリース信号の開始位置を含む区分
に先行する修正ポイントとの間の各区分に係る修正関数
値を、当該リリース信号の開始位置を含む区分と、上記
先行する修正ポイントとの間における最大のピークの絶
対値が、上記目標ピーク値に等しくなるように計算する
ことを特徴とする。
Further, in the audio signal encoding method, the step of calculating the correction function includes a section including a start position of the attack signal and a correction point preceding the section including a start position of the attack signal. The correction function value for each section between is calculated so that the absolute value of the maximum peak between the section including the start position of the attack signal and the preceding correction point is equal to the target peak value. However, the correction function value related to each section between the section including the start position of the release signal and the correction point preceding the section including the start position of the release signal, and the section including the start position of the release signal, , The absolute value of the maximum peak with respect to the preceding correction point is calculated so as to be equal to the target peak value.

【0018】また、上記オーディオ信号の符号化方法に
おいて、上記利得制御するステップは、上記分割された
区分を有するオーディオ信号に基づいて、発話音声に含
まれる所定のゆるやかな勾配で自然に降下する第1の信
号部分を検出するステップと、上記分割された区分を有
するオーディオ信号に基づいて、発話音声に含まれる所
定のゆるやかな勾配で自然に上昇する第2の信号部分を
検出するステップとの少なくとも一方を含み、上記利得
制御するステップは、処理すべき現在のフレームにおい
て、上記識別されたアタック信号の開始位置を含む区分
と、上記識別されたリリース信号の終了位置を含む区分
とに基づいて、上記検出された第1の信号部分の修正関
数による利得制御を中止する一方、上記識別されたアタ
ック信号に基づいて計算される修正関数を減少させて上
記第2の信号部分の修正関数を計算することにより、当
該現在のフレームにおける修正関数を計算することを特
徴とする。
In the audio signal encoding method, the step of controlling the gain naturally lowers at a predetermined gentle gradient included in the uttered voice based on the audio signal having the divided sections. At least the step of detecting the first signal portion, and the step of detecting the second signal portion that naturally rises at a predetermined gentle gradient included in the speech based on the audio signal having the divided sections. Including one, the gain controlling step is based on a segment including a start position of the identified attack signal and a segment including an end position of the identified release signal in a current frame to be processed, Based on the identified attack signal while stopping the gain control by the correction function of the detected first signal portion. Reduce the correction function is calculated by calculating the correction function of the second signal portion, and calculates a correction function in the current frame.

【0019】さらに、上記オーディオ信号の符号化方法
において、上記第1の信号部分を検出するステップは、
上記現在のフレームに先行するフレームにおいて修正ポ
イントである区分の数が所定の第1のしきい値より小さ
く、かつ現在のフレームにアタック信号が含まれていな
いときに、上記第1の信号部分が存在すると決定し、上
記第2の信号部分を検出するステップは、上記アタック
信号の開始位置を含む区分と、当該区分から当該区分に
続く次の修正ポイントまでの間における最大のピークの
絶対値が存在する区分との間の分離区分数が所定の第2
のしきい値より大きいときに、上記第2の信号部分が存
在すると決定することを特徴とする。
Further, in the audio signal encoding method, the step of detecting the first signal portion includes:
When the number of sections that are correction points in a frame preceding the current frame is less than a predetermined first threshold and the current frame does not include an attack signal, the first signal portion is The step of detecting the presence of the second signal portion, which is determined to be present, determines that the absolute value of the maximum peak between the section including the start position of the attack signal and the next correction point subsequent to the section. The number of separation divisions between existing divisions is the second
It is determined that the second signal portion is present when it is larger than the threshold value of.

【0020】またさらに、上記オーディオ信号の符号化
方法において、上記修正関数を計算するステップは、上
記互いに隣接した2つのフレームである第1及び第2の
フレームにおいて、上記利得制御後のオーディオ信号の
うちの第1のフレームのピークの絶対値と第2のフレー
ムのピークの絶対値とが異なるとき、上記各ピークの絶
対値が等しくなるように、上記第2のフレームの最初の
区分に係る修正関数値を補正するステップをさらに含む
ことを特徴とする。
Furthermore, in the above-mentioned audio signal encoding method, the step of calculating the correction function includes the step of calculating the gain-controlled audio signal in the first and second frames, which are the two adjacent frames. Modification relating to the first division of the second frame so that when the absolute value of the peak of the first frame and the absolute value of the peak of the second frame are different, the absolute values of the peaks are equal to each other The method further comprises the step of correcting the function value.

【0021】また、上記オーディオ信号の符号化方法に
おいて、上記利得制御するステップは、上記利得制御の
処理の後に、上記互いに隣接した2つのフレームである
第1及び第2のフレームのオーディオ信号が互いに実質
的に連続するように、第1のフレームのオーディオ信号
に対して第2のフレームの最初の区分に係る修正関数値
を乗算して補正するステップをさらに含み、上記修正関
数を計算するステップは、上記第1のフレームの各区分
に係る修正関数値のうちの、オーディオ信号を増幅する
最小の修正関数値に基づいて、上記オーディオ信号を増
幅する修正関数により利得制御されるべき第1のフレー
ムのオーディオ信号を、上記乗算して補正することによ
り減衰させることを防止するように、上記第2のフレー
ムの最初の区分に係る修正関数値を補正するステップを
さらに含むことを特徴とする。
In the audio signal encoding method, in the gain control step, after the gain control process, the audio signals of the first frame and the second frame, which are the two adjacent frames, are mutually separated. The method further comprises the step of multiplying the audio signal of the first frame by a correction function value associated with the first section of the second frame so as to be substantially continuous, and calculating the correction function. A first frame to be gain-controlled by a correction function for amplifying the audio signal based on a minimum correction function value for amplifying the audio signal among correction function values for each section of the first frame, Of the first frame of the second frame so as to prevent the above audio signal from being attenuated by the multiplication and correction. And further comprising a step of correcting a correction function value that.

【0022】さらに、上記オーディオ信号の符号化方法
において、上記修正関数を計算するステップは、処理す
べき現在のフレームにおける最後の修正ポイントの区分
より後方に位置する現在のフレームの各区分における最
大のピークの絶対値が上記目標ピーク値と異なるとき
に、上記最大のピークの絶対値が上記目標ピーク値に等
しくなるように、上記後方に位置する現在のフレームの
各区分に係る修正関数値を補正するステップをさらに含
むことを特徴とする。
Furthermore, in the above-mentioned audio signal encoding method, the step of calculating the correction function includes the maximum in each section of the current frame located after the section of the last correction point in the current frame to be processed. When the absolute value of the peak is different from the target peak value, the correction function value related to each section of the current frame located behind is corrected so that the absolute value of the maximum peak becomes equal to the target peak value. The method further comprises the step of:

【0023】また、本発明の第2の態様に係るオーディ
オ信号の符号化方法は、入力されたオーディオ信号に基
づいてフレーム毎に修正関数を計算して、計算された修
正関数に従って上記オーディオ信号に対して利得制御す
るステップと、上記利得制御されたオーディオ信号に対
して、縦続接続された互いに隣接する2つのフレーム毎
に直交変換処理を行いかつ符号化処理を行うことにより
符号化されたビットストリーム信号を得るステップとを
含むオーディオ信号の符号化方法において、上記利得制
御するステップは、入力されたオーディオ信号をフレー
ムの時間よりも短い時間の複数の区分に分割するステッ
プと、上記分割された区分を有するオーディオ信号に基
づいて、急激な音の立上がりを含む信号の部分であるア
タック信号の開始位置を含む区分を修正ポイントとして
識別するステップと、上記分割された区分を有するオー
ディオ信号に基づいて、急激な音の立下がりを含む信号
の部分であるリリース信号の終了位置を含む区分を修正
ポイントとして識別するステップと、上記分割された区
分を有するオーディオ信号に基づいて、発話音声に含ま
れる所定のゆるやかな勾配で自然に降下する第1の信号
部分を検出するステップと、上記分割された区分を有す
るオーディオ信号に基づいて、発話音声に含まれる所定
のゆるやかな勾配で自然に上昇する第2の信号部分を検
出するステップとの少なくとも一方を含み、上記利得制
御するステップは、処理すべき現在のフレームにおい
て、上記識別されたアタック信号の開始位置を含む区分
と、上記識別されたリリース信号の終了位置を含む区分
とに基づいて、上記検出された第1の信号部分の修正関
数による利得制御を中止する一方、上記識別されたアタ
ック信号に基づいて計算される修正関数を減少させて上
記第2の信号部分の修正関数を計算することにより、当
該現在のフレームにおける修正関数を計算するステップ
とを含むことを特徴とするオーディオ信号の符号化方
法。
Further, in the audio signal encoding method according to the second aspect of the present invention, a correction function is calculated for each frame based on the input audio signal, and the audio signal is converted into the audio signal according to the calculated correction function. A gain control step for the gain control, and a bit stream encoded by performing an orthogonal transformation process and an encoding process for every two adjacent frames that are cascade-connected to the gain-controlled audio signal. In the method of encoding an audio signal, including the step of obtaining a signal, the step of controlling the gain comprises the steps of dividing the input audio signal into a plurality of sections having a time shorter than the time of a frame, and the divided sections. The start of the attack signal, which is the part of the signal that contains a sudden sound rise, based on the audio signal having Identifying the section containing the position as a correction point, and based on the audio signal having the divided section, the section containing the end position of the release signal, which is the portion of the signal containing the sudden fall of the sound, is the correction point. And detecting the first signal portion that naturally falls at a predetermined gentle gradient included in the speech based on the audio signal having the divided section, and the divided section. And / or detecting a second signal portion that naturally rises with a predetermined gentle slope contained in the speech based on the audio signal having In the frame, the section including the start position of the identified attack signal and the end of the identified release signal Based on the segment including the position, the gain control by the correction function of the detected first signal portion is stopped, while the correction function calculated based on the identified attack signal is decreased to reduce the second function. Calculating a correction function of the signal part of the current frame to calculate a correction function in the current frame.

【0024】上記オーディオ信号の符号化方法におい
て、上記第1の信号部分を検出するステップは、上記現
在のフレームに先行するフレームにおいて修正ポイント
である区分の数が所定の第1のしきい値より小さく、か
つ現在のフレームにアタック信号が含まれていないとき
に、上記第1の信号部分が存在すると決定し、上記第2
の信号部分を検出するステップは、上記アタック信号の
開始位置を含む区分と、当該区分から当該区分に続く次
の修正ポイントまでの間における最大のピークの絶対値
が存在する区分との間の分離区分数が所定の第2のしき
い値より大きいときに、上記第2の信号部分が存在する
と決定することを特徴とする。
In the above-mentioned audio signal encoding method, the step of detecting the first signal portion includes the step of detecting the number of sections which are correction points in a frame preceding the current frame from a predetermined first threshold value. It is determined that the first signal portion is present when the attack signal is small and the current frame does not include an attack signal, and
The step of detecting the signal part of the separation between the section including the start position of the attack signal and the section in which the absolute value of the maximum peak between the section and the next correction point following the section exists. It is characterized in that the second signal portion is determined to exist when the number of sections is larger than a predetermined second threshold value.

【0025】本発明の第3の態様に係るオーディオ信号
の符号化装置は、入力されたオーディオ信号に基づいて
フレーム毎に修正関数を計算して、計算された修正関数
に従って上記オーディオ信号に対して利得制御する利得
制御手段と、上記利得制御されたオーディオ信号に対し
て、縦続接続された互いに隣接する2つのフレーム毎に
直交変換処理を行いかつ符号化処理を行うことにより符
号化されたビットストリーム信号を得る手段とを備えた
オーディオ信号の符号化装置において、上記利得制御手
段は、入力されたオーディオ信号をフレームの時間より
も短い時間の複数の区分に分割し、上記分割された各区
分のピークの絶対値を計算する区分のピーク値計算手段
と、上記分割された区分を有するオーディオ信号に基づ
いて、急激な音の立上がりを含む信号の部分であるアタ
ック信号の開始位置を含む区分を修正ポイントとして識
別する第1の識別手段と、上記分割された区分を有する
オーディオ信号に基づいて、急激な音の立下がりを含む
信号の部分であるリリース信号の終了位置を含む区分を
修正ポイントとして識別する第2の識別手段と、上記分
割された区分を有するオーディオ信号に基づいて、上記
修正関数に従って利得制御したときに所望される、処理
すべき現在のフレームにおける目標ピーク値を計算する
目標ピーク値計算手段と、上記識別されたアタック信号
の開始位置を含む区分と、上記識別されたリリース信号
の終了位置を含む区分と、上記計算された目標ピーク値
とに基づいて、当該現在のフレームの各区分に係る修正
関数値からなる修正関数を計算する修正関数計算手段と
を備えたことを特徴とする。
An audio signal encoding apparatus according to a third aspect of the present invention calculates a correction function for each frame based on an input audio signal, and outputs the correction function to the audio signal according to the calculated correction function. A gain control means for controlling the gain and a bit stream encoded by performing an orthogonal transformation process and an encoding process on every two adjacent frames that are cascade-connected to the gain-controlled audio signal. In the audio signal encoding device including means for obtaining a signal, the gain control means divides the input audio signal into a plurality of sections having a time shorter than a frame time, and the gain control means divides each of the divided sections. Based on the peak value calculation means of the section for calculating the absolute value of the peak and the audio signal having the above-mentioned divided sections, a sudden sound First identifying means for identifying, as a correction point, a section including a start position of an attack signal, which is a portion of a signal including a rising point, and a sharp fall of sound based on the audio signal having the divided section Second identification means for identifying a section including the end position of the release signal, which is a part of the signal, as a correction point, and desired when gain control is performed according to the correction function based on the audio signal having the divided section. A target peak value calculating means for calculating a target peak value in a current frame to be processed, a section including a start position of the identified attack signal, and a section including an end position of the identified release signal, Based on the calculated target peak value, calculate a correction function consisting of the correction function value for each section of the current frame. Characterized by comprising a positive function calculating means.

【0026】上記オーディオ信号の符号化装置におい
て、上記第1の識別手段は、処理すべき現在の区分に続
く次の区分のピークの絶対値と、当該現在の区分以前の
予め決められた数の区分に係る各ピークの絶対値との比
に基づいて、当該現在の区分がアタック信号の開始位置
を含むか否かを決定し、当該現在の区分が上記アタック
信号の開始位置を含むと決定されたときは、アタック信
号の開始位置を含むことを示す所定の第1の値を当該現
在の区分に割り当てることを特徴とする。
In the above audio signal coding apparatus, the first identifying means includes the absolute value of the peak of the next section following the current section to be processed, and a predetermined number before the current section. Based on the ratio to the absolute value of each peak related to the division, it is determined whether the current division includes the start position of the attack signal, and the current division is determined to include the start position of the attack signal. In this case, a predetermined first value indicating that the attack signal start position is included is assigned to the current section.

【0027】また、上記オーディオ信号の符号化装置に
おいて、上記第2の識別手段は、処理すべき現在の区分
と、当該現在の区分に先行する修正ポイントとの間にお
ける最大のピークの絶対値と、当該現在の区分以後の予
め決められた数の区分に係る各ピークの絶対値との比に
基づいて、当該現在の区分がリリース信号の終了位置を
含むか否かを決定し、当該現在の区分が上記リリース信
号の終了位置を含むと決定されたときは、リリース信号
の終了位置を含むことを示す所定の第2の値を当該現在
の区分に割り当てることを特徴とする。
In the audio signal coding apparatus, the second identifying means may detect the absolute value of the maximum peak between the current section to be processed and the correction point preceding the current section. , Determines whether or not the current segment includes the end position of the release signal, based on the ratio to the absolute value of each peak relating to a predetermined number of segments after the current segment, When it is determined that the segment includes the end position of the release signal, a predetermined second value indicating that the segment includes the end position of the release signal is assigned to the current segment.

【0028】さらに、上記オーディオ信号の符号化装置
において、上記目標ピーク値計算手段は、互いに隣接す
る各1対の修正ポイント間の最大のピークの絶対値と、
上記割り当てられた第1の値及び第2の値と、処理すべ
き現在のフレームに続く次のフレームの最初の区分に係
るピークの絶対値とに基づいて、当該処理すべき現在の
フレームのオーディオ信号を上記修正関数に従って利得
制御したときに所望される目標ピーク値を計算すること
を特徴とする。
Further, in the audio signal encoding device, the target peak value calculating means has the absolute value of the maximum peak between each pair of correction points adjacent to each other,
The audio of the current frame to be processed, based on the assigned first and second values and the absolute value of the peak associated with the first segment of the next frame following the current frame to be processed. It is characterized in that a desired target peak value is calculated when the signal is gain controlled according to the correction function.

【0029】またさらに、上記オーディオ信号の符号化
装置において、上記修正関数計算手段は、上記アタック
信号の開始位置を含む区分と、当該アタック信号の開始
位置を含む区分に先行する修正ポイントとの間の各区分
に係る修正関数値を、当該アタック信号の開始位置を含
む区分と、上記先行する修正ポイントとの間における最
大のピークの絶対値が、上記目標ピーク値に等しくなる
ように計算し、上記リリース信号の開始位置を含む区分
と、当該リリース信号の開始位置を含む区分に先行する
修正ポイントとの間の各区分に係る修正関数値を、当該
リリース信号の開始位置を含む区分と、上記先行する修
正ポイントとの間における最大のピークの絶対値が、上
記目標ピーク値に等しくなるように計算することを特徴
とする。
Further, in the audio signal coding device, the correction function calculating means is arranged between a section including a start position of the attack signal and a correction point preceding the section including a start position of the attack signal. The correction function value related to each section of, the absolute value of the maximum peak between the section including the start position of the attack signal and the preceding correction point is calculated to be equal to the target peak value, A section including the start position of the release signal, and a correction function value related to each section between the section including the start position of the release signal and the correction point preceding the section including the start position of the release signal; It is characterized in that the absolute value of the maximum peak between the preceding correction points is calculated so as to be equal to the target peak value.

【0030】また、上記オーディオ信号の符号化装置に
おいて、上記利得制御手段は、上記分割された区分を有
するオーディオ信号に基づいて、発話音声に含まれる所
定のゆるやかな勾配で自然に降下する第1の信号部分を
検出する第1の検出手段と、上記分割された区分を有す
るオーディオ信号に基づいて、発話音声に含まれる所定
のゆるやかな勾配で自然に上昇する第2の信号部分を検
出する第2の検出手段との少なくとも一方を備え、上記
利得制御手段は、処理すべき現在のフレームにおいて、
上記識別されたアタック信号の開始位置を含む区分と、
上記識別されたリリース信号の終了位置を含む区分とに
基づいて、上記検出された第1の信号部分の修正関数に
よる利得制御を中止する一方、上記識別されたアタック
信号に基づいて計算される修正関数を減少させて上記第
2の信号部分の修正関数を計算することにより、当該現
在のフレームにおける修正関数を計算することを特徴と
する。
Further, in the above audio signal coding apparatus, the gain control means, based on the audio signal having the divided sections, falls naturally at a predetermined gentle gradient included in the uttered voice. Detecting the second signal portion that naturally rises at a predetermined gentle gradient included in the uttered voice based on the audio signal having the divided sections. And at least one of the two detection means, wherein the gain control means comprises:
A segment including the start position of the identified attack signal,
Based on the section including the ending position of the identified release signal, the gain control by the modification function of the detected first signal portion is stopped, while the modification calculated based on the identified attack signal. It is characterized in that the correction function in the current frame is calculated by reducing the function and calculating the correction function of the second signal portion.

【0031】さらに、上記オーディオ信号の符号化装置
において、上記第1の検出手段は、上記現在のフレーム
に先行するフレームにおいて修正ポイントである区分の
数が所定の第1のしきい値より小さく、かつ現在のフレ
ームにアタック信号が含まれていないときに、上記第1
の信号部分が存在すると決定し、上記第2の検出手段
は、上記アタック信号の開始位置を含む区分と、当該区
分から当該区分に続く次の修正ポイントまでの間におけ
る最大のピークの絶対値が存在する区分との間の分離区
分数が所定の第2のしきい値より大きいときに、上記第
2の信号部分が存在すると決定することを特徴とする。
Further, in the audio signal encoding device, the first detecting means has a number of sections which are correction points in a frame preceding the current frame smaller than a predetermined first threshold value, And when the current frame does not include an attack signal,
Is determined to be present, the second detection means determines that the absolute value of the maximum peak between the section including the start position of the attack signal and the next correction point following the section is It is characterized in that it is determined that the second signal portion is present when the number of separated partitions from existing partitions is larger than a predetermined second threshold value.

【0032】またさらに、上記オーディオ信号の符号化
装置において、上記修正関数計算手段は、上記互いに隣
接した2つのフレームである第1及び第2のフレームに
おいて、上記利得制御後のオーディオ信号のうちの第1
のフレームのピークの絶対値と第2のフレームのピーク
の絶対値とが異なるとき、上記各ピークの絶対値が等し
くなるように、上記第2のフレームの最初の区分に係る
修正関数値を補正することを特徴とする。
Further, in the above audio signal coding apparatus, the correction function calculating means includes, in the first and second frames, which are the two adjacent frames, of the audio signal after the gain control. First
When the absolute value of the peak of the second frame is different from the absolute value of the peak of the second frame, the correction function value related to the first section of the second frame is corrected so that the absolute values of the peaks are equal to each other. It is characterized by doing.

【0033】また、上記オーディオ信号の符号化装置に
おいて、上記利得制御手段は、上記利得制御の処理の後
に、上記互いに隣接した2つのフレームである第1及び
第2のフレームのオーディオ信号が互いに実質的に連続
するように、第1のフレームのオーディオ信号に対して
第2のフレームの最初の区分に係る修正関数値を乗算し
て補正する乗算器をさらに備え、上記修正関数計算手段
は、上記第1のフレームの各区分に係る修正関数値のう
ちの、オーディオ信号を増幅する最小の修正関数値に基
づいて、上記オーディオ信号を増幅する修正関数により
利得制御されるべき第1のフレームのオーディオ信号
を、上記乗算して補正することにより減衰させることを
防止するように、上記第2のフレームの最初の区分に係
る修正関数値を補正することを特徴とする。
Further, in the audio signal encoding device, the gain control means, after the gain control processing, causes the audio signals of the first and second frames, which are the two adjacent frames, to be substantially mutually. Further comprising a multiplier for multiplying and correcting the audio signal of the first frame by the correction function value of the first section of the second frame so as to be continuously continuous. The audio of the first frame to be gain-controlled by the correction function that amplifies the audio signal based on the minimum correction function value that amplifies the audio signal among the correction function values related to each section of the first frame. Correct the correction function value for the first section of the second frame to prevent the signal from being attenuated by the multiplying and correcting. And wherein the Rukoto.

【0034】さらに、上記オーディオ信号の符号化装置
において、上記修正関数計算手段は、処理すべき現在の
フレームにおける最後の修正ポイントの区分より後方に
位置する現在のフレームの各区分における最大のピーク
の絶対値が上記目標ピーク値と異なるときに、上記最大
のピークの絶対値が上記目標ピーク値に等しくなるよう
に、上記後方に位置する現在のフレームの各区分に係る
修正関数値を補正することを特徴とする。
Further, in the above audio signal coding apparatus, the correction function calculation means may determine the maximum peak in each section of the current frame located after the section of the last correction point in the current frame to be processed. When the absolute value is different from the target peak value, the correction function value related to each section of the current frame located behind is corrected so that the absolute value of the maximum peak becomes equal to the target peak value. Is characterized by.

【0035】また、本発明の第4の態様に係るオーディ
オ信号の符号化装置は、入力されたオーディオ信号に基
づいてフレーム毎に修正関数を計算して、計算された修
正関数に従って上記オーディオ信号に対して利得制御す
る利得制御手段と、上記利得制御されたオーディオ信号
に対して、縦続接続された互いに隣接する2つのフレー
ム毎に直交変換処理を行いかつ符号化処理を行うことに
より符号化されたビットストリーム信号を得る手段とを
備えたオーディオ信号の符号化装置において、上記利得
制御手段は、入力されたオーディオ信号をフレームの時
間よりも短い時間の複数の区分に分割する手段と、上記
分割された区分を有するオーディオ信号に基づいて、急
激な音の立上がりを含む信号の部分であるアタック信号
の開始位置を含む区分を修正ポイントとして識別する第
3の識別手段と、上記分割された区分を有するオーディ
オ信号に基づいて、急激な音の立下がりを含む信号の部
分であるリリース信号の終了位置を含む区分を修正ポイ
ントとして識別する第4の識別手段と、上記分割された
区分を有するオーディオ信号に基づいて、発話音声に含
まれる所定のゆるやかな勾配で自然に降下する第1の信
号部分を検出する第3の検出手段と、上記分割された区
分を有するオーディオ信号に基づいて、発話音声に含ま
れる所定のゆるやかな勾配で自然に上昇する2の信号部
分を検出する第4の検出手段との少なくとも一方を備
え、上記利得制御手段は、処理すべき現在のフレームに
おいて、上記識別されたアタック信号の開始位置を含む
区分と、上記識別されたリリース信号の終了位置を含む
区分とに基づいて、上記検出された第1の信号部分の修
正関数による利得制御を中止する一方、上記識別された
アタック信号に基づいて計算される修正関数を減少させ
て上記第2の信号部分の修正関数を計算することによ
り、当該現在のフレームにおける修正関数を計算する修
正関数計算手段とを備えたことを特徴とする。
Further, the audio signal encoding apparatus according to the fourth aspect of the present invention calculates a correction function for each frame based on the input audio signal, and converts the audio signal into the audio signal according to the calculated correction function. The gain control means for controlling the gain and the gain-controlled audio signal are encoded by performing an orthogonal transform process and an encoding process for every two adjacent frames that are connected in cascade. In the audio signal coding apparatus, which comprises a means for obtaining a bitstream signal, the gain control means divides the input audio signal into a plurality of sections having a time shorter than a frame time, and Based on an audio signal having a distinct section, including the start position of the attack signal, which is the part of the signal that contains a sudden rise in sound The third identifying means for identifying the minute as a correction point, and the section including the end position of the release signal, which is the portion of the signal including the abrupt fall of the sound, are corrected based on the audio signal having the divided section A fourth identifying means for identifying the point and a third signal portion for naturally descending at a predetermined gentle gradient included in the uttered voice based on the audio signal having the divided sections. At least one of the detection means and the fourth detection means for detecting the two signal portions that naturally rise at a predetermined gentle gradient included in the speech based on the audio signal having the divided sections is provided. The gain control means includes a section including a start position of the identified attack signal in the current frame to be processed, and the identified release signal. Based on the segment including the end position, the gain control by the correction function of the detected first signal portion is stopped, while the correction function calculated based on the identified attack signal is decreased to reduce the correction function. And a correction function calculating means for calculating the correction function in the current frame by calculating the correction function of the second signal portion.

【0036】上記オーディオ信号の符号化装置におい
て、上記第3の検出手段は、上記現在のフレームに先行
するフレームにおいて修正ポイントである区分の数が所
定の第1のしきい値より小さく、かつ現在のフレームに
アタック信号が含まれていないときに、上記第1の信号
部分が存在すると決定し、上記第4の検出手段は、上記
アタック信号の開始位置を含む区分と、当該区分から当
該区分に続く次の修正ポイントまでの間における最大の
ピークの絶対値が存在する区分との間の分離区分数が所
定の第2のしきい値より大きいときに、上記第2の信号
部分が存在すると決定することを特徴とする。
In the audio signal encoding device, the third detecting means has a number of sections, which are correction points, in a frame preceding the current frame being smaller than a predetermined first threshold value, and When the frame does not include an attack signal, it is determined that the first signal portion is present, and the fourth detecting means changes from the section including the start position of the attack signal to the section. It is determined that the second signal portion is present when the number of separation segments between the segment having the maximum absolute value of the peak up to the next correction point is greater than a predetermined second threshold value. It is characterized by doing.

【0037】本発明の第5の態様に係るオーディオ信号
の符号化及び復号化システムは、上記オーディオ信号の
符号化装置と、オーディオ信号の復号化装置とを備え、
上記オーディオ信号の復号化装置は、上記符号化装置に
より符号化されたビットストリーム信号を復号化しかつ
逆直交変換処理を行うことにより、複数のフレームから
なるオーディオ信号を得る手段と、上記得られたオーデ
ィオ信号に対して、上記修正関数とは逆の修正関数を用
いて逆利得制御を行って逆利得制御されたオーディオ信
号を得て出力する手段とを備えたことを特徴とする。
An audio signal encoding and decoding system according to a fifth aspect of the present invention comprises the above audio signal encoding device and an audio signal decoding device,
The audio signal decoding device obtains an audio signal composed of a plurality of frames by decoding the bit stream signal encoded by the encoding device and performing an inverse orthogonal transform process; Means for performing an inverse gain control on the audio signal by using a correction function opposite to the above-mentioned correction function, and obtaining and outputting the audio signal subjected to the inverse gain control.

【0038】また、本発明の別の態様に係る符号化方法
は、ディジタルオーディオ信号の複数の時間サンプルよ
りなるフレームに対して増幅又は減衰の利得係数である
修正レベルalevcodeと上記修正レベルの位置である修正
位置aloccodeとを決定して、プリエコー及びポストエコ
ーの抑圧とアーティファクトの最小化とを達成するため
の方法であって、(a)複数の時間サンプルよりなる上
記フレームを、それぞれが等しい個数の時間サンプルよ
りなる複数の区分に分割するステップと、(b)リリー
ス信号と、フレームの境界におけるアタック信号とのよ
り効果的な制御とに取り組むために、現在のフレームの
次に続くフレーム(未来フレーム)の予め決められた数
の区分をバッファリングするステップと、(c)各区分
におけるすべての時間サンプルの信号レベルに係るピー
クの絶対値MaxPeakを計算するステップと、(d)所定
のアタック信号の基準を用いてアタック信号の立上がり
の開始位置を検出するステップと、(e)増幅が実行さ
れる必要がある上記検出された開始位置を、アタックポ
イントとしてマーキングするステップと、(f)所定の
リリース信号の基準を用いてリリース信号の立下がりの
終了位置を検出するステップと、(g)上記検出された
終了位置をリリースポイントとしてマーキングし、かつ
上記各リリースポイントに対して望ましい減衰の利得係
数を指定するステップと、(h)互いに隣接するすべて
の修正ポイント(すべてのアタックポイント及びリリー
スポイント)の間において、最大のピークの絶対値MaxP
eakをそれぞれ位置決めし、上記ピークの絶対値をピー
ク値InterModMaxPeakに記憶し、上記ピークの絶対値の
位置をピーク位置InterModMaxLocに記憶するステップ
と、(i)当該信号を等化させるための目標となる、信
号レベルの目標ピーク値CurrFramePeakを計算するステ
ップと、(j)当該信号が自然な降下を示しているか否
かをチェックするステップと、(k)上記自然な降下に
対処するステップと、(l)信号レベルの目標ピーク値
CurrFramePeakを用いて、上記マーキングされたすべて
の修正ポイントに対する修正レベルを計算するステップ
と、(m)当該アタック信号が自然な上昇を示している
か否かをチェックするステップと、(n)上記自然な上
昇に対処するステップと、(o)同一の修正レベルの利
得係数を有しかつ互いに連続する修正ポイントを統合す
るステップと、(p)複数の時間サンプルよりなる現在
のフレームの利得制御後の信号レベルが、(同様に、複
数の時間サンプルよりなる)現在のフレームに先行する
フレームの利得制御後の信号レベルに対して有意な差分
を有するか否かをチェックするステップと、(q)上記
差分に対処するステップと、(r)現在のフレームに先
行するフレームの過度の減衰を防止するために、現在の
フレームの最初の修正ポイントの修正レベルを制限する
ステップと、(s)上記利得制御されたフレームの終端
の信号レベルが、当該フレームの上記終端よりも前の部
分に比べて弱いか否かをチェックするステップと、
(t)信号レベルの目標ピーク値CurrFramePeakに等し
くなるように、上記終端を増幅する(又は減衰する)ス
テップとを含むことを特徴とする。
Also, the encoding method according to another aspect of the present invention uses a correction level alevcode, which is a gain coefficient for amplification or attenuation, and a position of the correction level with respect to a frame composed of a plurality of time samples of a digital audio signal. A method for determining a modified position aloc code to achieve suppression of pre-echo and post-echo and minimization of artifacts, the method comprising: (a) the frame consisting of a plurality of time samples, each of which has an equal number of To address the step of dividing into multiple sections of time samples, and (b) more effective control of the release signal and the attack signal at the frame boundaries, the frame following the current frame (future frame) ) Buffering a predetermined number of partitions, and (c) all time services in each partition. A step of calculating an absolute value MaxPeak of the peak related to the signal level of the sample; (d) a step of detecting a rising start position of the attack signal using a predetermined attack signal reference; and (e) amplification. Marking the detected start position that is necessary as an attack point; (f) detecting the end position of the trailing edge of the release signal using a predetermined release signal reference; (g) the detection Marking the marked end position as a release point and specifying the desired attenuation gain factor for each release point, (h) of all modification points (all attack points and release points) adjacent to each other. Absolute value of the maximum peak between
Positioning each eak, storing the absolute value of the peak in the peak value InterModMaxPeak, and storing the position of the absolute value of the peak in the peak position InterModMaxLoc, and (i) a target for equalizing the signal. , A step of calculating a target peak value CurrFramePeak of the signal level, (j) a step of checking whether or not the signal shows a natural drop, (k) a step of coping with the natural drop, and (l) ) Signal level target peak value
CurrFramePeak is used to calculate correction levels for all marked correction points; (m) check if the attack signal shows a natural rise; and (n) measure the natural Coping with the ascent, (o) integrating correction points having gain factors of the same modification level and consecutive to each other, (p) the signal after gain control of the current frame consisting of multiple time samples Checking whether the level has a significant difference to the signal level after gain control of the frame preceding the current frame (also consisting of a plurality of time samples), and (q) the difference And (r) the first correction point of the current frame to prevent excessive attenuation of the frame preceding the current frame. Limiting the modification level of the input signal, and (s) checking whether the signal level at the end of the gain-controlled frame is weaker than that before the end of the frame.
(T) amplifying (or attenuating) the end so that the signal level becomes equal to the target peak value CurrFramePeak.

【0039】上記オーディオ信号の符号化方法におい
て、上記アタック信号の基準は、潜在的なアタックポイ
ントに先行する予め決められた数の区分の最大のピーク
の絶対値MaxPeakのそれぞれに対する、当該潜在的なア
タックポイントのピークの絶対値MaxPeakの比に基づ
き、上記潜在的なアタックポイントに先行する区分数
が、上記予め決められた数を達成するには不十分である
ときは、上記ピークの絶対値MaxPeakの代わりに、複数
の時間サンプルよりなる利得制御された先行するフレー
ムのピークの絶対値PrevFramePeakに基づき、この比が
予め決められたしきい値を超えていることを必要とし、
潜在的なアタックポイントと先行するアタックポイント
との分離が、予め決められた区分数を超えていることを
必要とする。
In the audio signal encoding method, the attack signal criterion is the potential of each of the maximum peak absolute values MaxPeak of a predetermined number of sections preceding a potential attack point. Based on the ratio of the absolute value MaxPeak of the peak of the attack point, when the number of categories preceding the potential attack point is insufficient to achieve the predetermined number, the absolute value MaxPeak of the peak Instead of, based on the absolute value PrevFramePeak of the peak of the gain-controlled preceding frame consisting of multiple time samples, we require that this ratio exceeds a predetermined threshold,
It is necessary that the separation between the potential attack point and the preceding attack point exceeds a predetermined number of sections.

【0040】また、上記オーディオ信号の符号化方法に
おいて、アタックポイントに対する上記マーキングの動
作は、予め決められた正の値を上記アタックポイントの
修正レベルalevcodeに指定することと、上記アタックポ
イントの区分のインデックスをaloccodeに記憶すること
とを特徴とする。
In the audio signal coding method, the marking operation for the attack point is performed by designating a predetermined positive value in the modification level alevcode of the attack point and by distinguishing the attack point from each other. The index is stored in the aloccode.

【0041】さらに、上記オーディオ信号の符号化方法
において、上記リリース信号の基準は、潜在的なリリー
スポイント以後の予め決められた数の区分の最大のピー
クの絶対値MaxPeakのそれぞれに対する、当該潜在的な
リリースポイントに先行するピーク値InterModMaxPeak
の比であり、かつ、この比が予め決められたしきい値を
超えていることを必要とし、上記しきい値は、上記潜在
的なリリースポイントに先行する修正ポイントのタイプ
が、アタックであるか又はリリースであるかに従って可
変であることを特徴とする。
Further, in the above audio signal encoding method, the reference of the release signal is the potential of each of the maximum peak absolute values MaxPeak of a predetermined number of sections after the potential release point. Value that precedes a specific release point InterModMaxPeak
And the ratio needs to exceed a predetermined threshold, the threshold being the type of modification point preceding the potential release point is an attack. It is variable according to whether it is a release or a release.

【0042】またさらに、上記オーディオ信号の符号化
方法において、上記マーキングの動作は、上記リリース
ポイントより前で発見されたピーク値InterModMaxPeak
の大きさに従って当該リリースポイントの修正レベルal
evcodeを設定することと、区分のインデックスを上記リ
リースポイントの修正位置aloccodeに記憶することとを
特徴とする。
Furthermore, in the above-mentioned audio signal encoding method, the marking operation is performed by the peak value InterModMaxPeak found before the release point.
The modification level al of the release point according to the size of
It is characterized in that evcode is set and the index of the division is stored in the correction position aloccode of the release point.

【0043】また、上記オーディオ信号の符号化方法に
おいて、上記目標ピーク値CurrFramePeakは、互いに隣
接するすべての修正ポイント間のピークの絶対値InterM
odMaxPeakと、現在のフレームのすべての修正レベルale
vcodeの係数と、未来フレームの第1の区分のピークの
絶対値MaxPeakとに基づくことを特徴とする。
In the audio signal encoding method, the target peak value CurrFramePeak is the absolute value InterM of peaks between all correction points adjacent to each other.
odMaxPeak and all modification levels of the current frame ale
It is characterized in that it is based on the coefficient of vcode and the absolute value MaxPeak of the peak of the first section of the future frame.

【0044】さらに、上記オーディオ信号の符号化方法
において、上記自然な降下をチェックするための基準
は、先行するフレームにおいて実行された修正の総数が
所定のしきい値より小さいことと、現在のフレームにお
いてマーキングされた修正ポイントがすべてリリース信
号のタイプに属していることとである。
Further, in the above method of encoding an audio signal, the criteria for checking the natural drop are that the total number of modifications performed in the preceding frame is less than a predetermined threshold, and that the current frame is All the correction points marked in 1. belong to the type of release signal.

【0045】またさらに、上記オーディオ信号の符号化
方法において、上記自然な降下に対処する動作は、発見
されたすべてのリリースポイントの除去であることを特
徴とする。
Furthermore, in the above-mentioned audio signal encoding method, the operation for coping with the natural drop is removal of all found release points.

【0046】また、上記オーディオ信号の符号化方法に
おいて、上記すべての修正ポイントに対する修正レベル
は、目標ピーク値CurrFramePeakと、上記修正ポイント
のそれぞれに先行するピーク値InterModMaxPeakとに基
づいて計算され、ピーク値InterModMaxPeakがゼロであ
るときは、上記計算において、上記ピーク値InterModMa
xPeakの代わりに予め決められたゼロでない小さな値が
用いられることを特徴とする。
In the audio signal encoding method, the correction levels for all the correction points are calculated based on the target peak value CurrFramePeak and the peak value InterModMaxPeak preceding each of the correction points. When InterModMaxPeak is zero, in the above calculation, the above peak value InterModMa
It is characterized in that a predetermined small non-zero value is used instead of xPeak.

【0047】さらに、上記オーディオ信号の符号化方法
において、上記自然な上昇をチェックするための基準
は、上記各アタックポイントの修正位置aloccodeと上記
アタックポイントの後に続くピーク位置InterModMaxLoc
との距離に基づくことを特徴とする。
Further, in the above-mentioned audio signal encoding method, the reference for checking the natural rise is the modified position aloccode of each attack point and the peak position InterModMaxLoc following the attack point.
It is based on the distance between and.

【0048】またさらに、上記オーディオ信号の符号化
方法において、上記自然な上昇に対処する動作は、上記
アタックポイントの修正レベルalevcodeを予め決められ
た量だけデクリメントすることを特徴とする。
Furthermore, in the audio signal encoding method, the operation for coping with the natural rise is characterized in that the modification level alevcode of the attack point is decremented by a predetermined amount.

【0049】また、上記オーディオ信号の符号化方法に
おいて、利得制御後の先行するフレームと利得制御後の
現在のフレームとの上記差分を評価するための基準は、
目標ピーク値CurrFramePeakの先行するフレームのピー
ク値PrevFramePeakに対する比に基づくことを特徴とす
る。
In the audio signal coding method, the reference for evaluating the difference between the preceding frame after gain control and the current frame after gain control is as follows.
It is characterized in that it is based on the ratio of the target peak value CurrFramePeak to the peak value PrevFramePeak of the preceding frame.

【0050】さらに、上記オーディオ信号の符号化方法
において、上記差分に対処する動作は、上記計算された
比から導出された修正レベルalevcodeを有する新しい修
正ポイントを挿入することであり、その修正位置alocco
deはフレームの最初の区分のインデックスに等しいこと
を特徴とする。
Further, in the above audio signal coding method, the operation for coping with the difference is to insert a new correction point having a correction level alevcode derived from the calculated ratio, the correction position alocco
de is characterized by being equal to the index of the first segment of the frame.

【0051】またさらに、上記オーディオ信号の符号化
方法において、上記最初の修正ポイントのレベルを制限
する動作は、現在のフレームに先行するフレームのすべ
てのアタックポイントに係る最小の修正レベルalevcode
に基づくことを特徴とする。
Furthermore, in the above-mentioned audio signal coding method, the operation of limiting the level of the first correction point is the minimum correction level alevcode relating to all attack points of the frame preceding the current frame.
It is based on.

【0052】また、上記オーディオ信号の符号化方法に
おいて、上記弱い終端をチェックするための基準は、最
後の修正ポイントの後に続くすべての区分の最大のピー
クの絶対値MaxPeakに対する、目標ピーク値CurrFramePe
akの比に基づくことを特徴とする。
In the audio signal coding method, the criterion for checking the weak termination is that the target peak value CurrFramePe with respect to the absolute value MaxPeak of the maximum peaks of all the sections following the last correction point.
It is characterized by being based on the ratio of ak.

【0053】さらに、上記オーディオ信号の符号化方法
において、上記終端を増幅する動作は、上記計算された
比から導出された修正レベルalevcodeを有する新しい修
正ポイントを挿入することであり、その修正位置alocco
deはフレームの最後の区分のインデックスに等しいこと
を特徴とする。
Further, in the above method of encoding an audio signal, the operation of amplifying the termination is to insert a new correction point having a correction level alevcode derived from the calculated ratio, and its correction position alocco.
de is characterized by being equal to the index of the last segment of the frame.

【0054】[0054]

【発明の実施の形態】以下、図面を参照して本発明の実
施形態について説明する。本願明細書では、ATRAC
3のためのミニディスク記録再生システムを一実施形態
として参照して説明するが、本発明の符号化方法は、利
得制御を用いる他の符号化器にも適用することができ
る。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings. As used herein, ATRAC
Although a mini disk recording / reproducing system for 3 will be described as an embodiment, the encoding method of the present invention can be applied to other encoders using gain control.

【0055】図1は、本発明の一実施形態に係るミニデ
ィスク記録再生システムの構成を示すブロック図であ
る。この実施形態は、特に、オーディオエンコーダ2内
の詳細構成に特徴を有している。
FIG. 1 is a block diagram showing the configuration of a mini disk recording / reproducing system according to an embodiment of the present invention. This embodiment is particularly characterized by the detailed configuration inside the audio encoder 2.

【0056】図1において、A/Dコンバータ1はオー
ディオ入力信号をA/D変換してディジタル化されたオ
ーディオサンプル信号に変換し、次いで、オーディオエ
ンコーダ2は、詳細後述するような利得制御方法を用い
て上記変換されたオーディオサンプル信号を圧縮して符
号化し、ATRAC3のビットストリーム信号を発生す
る。次いで、ミニディスク記録装置3は、ATRAC3
のビットストリーム信号を所定の変調記録信号に変調し
た後、上記変調記録信号をミニディスク4に記録する。
一方、ミニディスク再生装置5は、ミニディスク4から
記録信号を再生して復調することにより、ATRAC3
のビットストリーム信号を再生する。さらに、オーディ
オデコーダ6は圧縮されているATRAC3のビットス
トリーム信号に対して、上記利得制御方法とは逆の逆利
得制御方法を用いてその利得を制御しながらディジタル
オーディオ信号に復号化した後、最後にD/Aコンバー
タ7はディジタルオーディオ信号をD/A変換してオー
ディオ出力信号を出力する。
In FIG. 1, an A / D converter 1 A / D converts an audio input signal to convert it into a digitized audio sample signal, and then an audio encoder 2 uses a gain control method as will be described later in detail. It is used to compress and encode the converted audio sample signal to generate an ATRAC3 bitstream signal. Next, the mini disk recording device 3 is set to ATRAC3.
After modulating the bit stream signal of 1 to a predetermined modulation recording signal, the modulation recording signal is recorded on the mini disk 4.
On the other hand, the mini-disc reproducing device 5 reproduces the recording signal from the mini-disc 4 and demodulates it so that the ATRAC3
Play the bitstream signal of. Further, the audio decoder 6 decodes the compressed bit stream signal of the ATRAC3 into a digital audio signal while controlling the gain by using an inverse gain control method which is the reverse of the above gain control method. The D / A converter 7 D / A converts the digital audio signal and outputs an audio output signal.

【0057】上述の利得制御及び逆利得制御によって、
ディジタルオーディオ信号の符号化及び復号化の際に発
生するプリエコー雑音及びポストエコー雑音を抑圧する
ことができる。この実施形態では、記録再生システム
は、ATRAC3のビットストリーム信号をミニディス
ク4に記録するように構成されているが、本発明はこれ
に限らず、その他の記録媒体または伝送媒体を用いるよ
うに記録再生システムや伝送システムを構成してもよ
い。
By the above gain control and inverse gain control,
It is possible to suppress pre-echo noise and post-echo noise that occur when encoding and decoding a digital audio signal. In this embodiment, the recording / reproducing system is configured to record the bit stream signal of the ATRAC3 on the mini disc 4, but the present invention is not limited to this, and recording is performed using another recording medium or transmission medium. A reproduction system and a transmission system may be configured.

【0058】図2は、図1のオーディオエンコーダ2の
詳細構成を示すブロック図である。図2において、オー
ディオエンコーダ2は、ATRAC3の音声信号圧縮技
術を用いた典型的な変換符号化器であるが、オーディオ
エンコーダ2の詳細構成のうち、特に、利得検出部14
及び利得制御部15−1乃至15−4の詳細構成におい
て特徴を有している。ATRAC3は、基本的に、4
4.1kHzでサンプリングされたオーディオサンプル
信号のストリームに対して構成された、サブバンド符号
化と変換符号化の技術のハイブリッド符号化方法であ
る。
FIG. 2 is a block diagram showing a detailed structure of the audio encoder 2 of FIG. In FIG. 2, the audio encoder 2 is a typical conversion encoder using the audio signal compression technique of the ATRAC 3, but among the detailed configuration of the audio encoder 2, in particular, the gain detection unit 14
The gain control units 15-1 to 15-4 are characterized by their detailed configurations. ATRAC3 is basically 4
It is a hybrid coding method of sub-band coding and transform coding technology, which is configured for a stream of audio sample signals sampled at 4.1 kHz.

【0059】図2に示すように、オーディオエンコーダ
2は、時間領域においてそれぞれ1024個のサンプル
を備える連続的なオーディオサンプル信号のフレーム
を、2ステージのQMFフィルタ10を用いて、4つの
部分帯域(サブバンド)信号に周波数帯域分割し、次
に、各部分帯域毎に、時間方向にそれぞれ256個のサ
ンプル信号を有するフレームに分割した信号(以下、サ
ブバンドフレームという。)を出力する。ここで、QM
F分割フィルタ10は、詳しくは、オーディオサンプル
信号を低域信号と高域信号に等分するローパスフィルタ
11及びハイパスフィルタ12と、上記分割された低域
及び高域信号を周波数についてさらに等分するフィルタ
バンク13−1乃至13−4とを備えて構成される。従
って、QMFフィルタ10の出力は、それぞれ256個
のサンプル信号を有する、4個のダウンサンプリングさ
れたサブバンドフレームである。それらの各々は、時間
軸上では、MDCT変換のための変換ブロックの半分の
長さであり、0乃至5.5kHz、5.5kHz乃至1
1kHz、11kHz乃至16.5kHz、及び16.
5kHz乃至22kHzの4つの周波数帯のそれぞれか
ら得られるオーディオ信号である。
As shown in FIG. 2, the audio encoder 2 uses a two-stage QMF filter 10 to generate four sub-bands (frames) of continuous audio sample signals each including 1024 samples in the time domain. A subband) signal is frequency-band-divided, and then a signal (hereinafter referred to as a subband frame) divided into frames each having 256 sample signals in the time direction is output for each partial band. Where QM
More specifically, the F division filter 10 divides the audio sample signal into a low-pass signal and a high-pass signal equally, and a low-pass filter 11 and a high-pass filter 12, and further divides the divided low-pass and high-pass signals into frequencies. The filter banks 13-1 to 13-4 are provided. Therefore, the output of QMF filter 10 is four downsampled subband frames, each having 256 sample signals. Each of them is half the length of a transform block for MDCT transform on the time axis, and is 0 to 5.5 kHz, 5.5 kHz to 1
1 kHz, 11 kHz to 16.5 kHz, and 16.
It is an audio signal obtained from each of four frequency bands of 5 kHz to 22 kHz.

【0060】なお、フィルタバンク13−1乃至13−
4の後段にそれぞれ、ジョイントステレオ処理を実行す
る回路部をさらに備えてもよい。ジョイントステレオ処
理の回路部は、例えば、ステレオ信号として入力された
オーディオ信号を、右チャンネル信号と左チャンネル信
号との平均信号と、右チャンネル信号の利得データと、
左チャンネル信号の利得データとに変換し、オーディオ
信号のさらなる圧縮を達成することができる。
The filter banks 13-1 to 13-
Each of the subsequent stages of 4 may further include a circuit unit that executes joint stereo processing. The circuit part of the joint stereo process, for example, an audio signal input as a stereo signal, an average signal of the right channel signal and the left channel signal, gain data of the right channel signal,
The left channel signal can be converted to gain data to achieve further compression of the audio signal.

【0061】次いで、修正関数を生成して、各サブバン
ドフレームに対して利得制御が実行される。ここで、フ
レーム中の各オーディオサンプル信号に対する利得制御
の大きさ(すなわち増幅率又は減衰率)を定義する利得
係数(又は、修正関数値と呼ぶ。)を、フレームを単位
としてまとめたものを「修正関数」と呼ぶ。フィルタバ
ンク13−1乃至13−4から出力された各サブバンド
フレームの信号は、利得検出部14と利得制御部15−
1乃至15−4にそれぞれ入力され、利得検出部14
は、バッファメモリ14aと修正関数計算部14bを備
えて構成され、各サブバンドフレームに対する修正関数
を計算して出力し、次いで、各利得制御部15−1乃至
15−4は、上記生成された修正関数を用いて各サブバ
ンドフレームに対して利得制御を実行する。以下、図4
を参照して、特に、フィルタバンク13−1から出力さ
れる0乃至5.5kHzの周波数帯のサブバンドフレー
ムについて説明する。
Then, a correction function is generated and gain control is executed for each subband frame. Here, a gain coefficient (or a correction function value) that defines the magnitude of gain control (that is, an amplification factor or an attenuation factor) for each audio sample signal in a frame is summarized in units of frames. Call it a "correction function". The signals of the sub-band frames output from the filter banks 13-1 to 13-4 are the gain detection unit 14 and the gain control unit 15-.
1 to 15-4, and the gain detector 14
Is composed of a buffer memory 14a and a correction function calculator 14b, calculates and outputs a correction function for each subband frame, and then each of the gain controllers 15-1 to 15-4 is generated as described above. Gain control is performed for each subband frame using a modification function. Below, FIG.
In particular, a subband frame in the frequency band of 0 to 5.5 kHz output from the filter bank 13-1 will be described with reference to FIG.

【0062】図4は、MDCT処理部15−1に先行す
る利得検出部14及び利得制御部15−1における変換
ブロックの生成を示すブロック図である。ここで、各オ
ーディオサンプル信号のストリームから構成される入力
されたオーディオ信号のうちで、i番目のサブバンド
(i=0,1,2,3)におけるn番目のオーディオフ
レームを「サブバンドフレーム[i][n]」として表
す。図4では、サブバンドのインデックスi=0であ
る。また、修正関数計算部14bは、n−1番目のサブ
バンドフレーム[i][n−1]の修正関数を計算する
ときに14b−aで図示され、n番目のサブバンドフレ
ーム[i][n]の修正関数を計算するときに14b−
bで図示され、かつ、n+1番目のサブバンドフレーム
[i][n+1]の修正関数を計算するときに14b−
cで図示されているが、これらは同一の修正関数計算部
14bを便宜的に分けて図示したものである。
FIG. 4 is a block diagram showing the generation of conversion blocks in the gain detection section 14 and the gain control section 15-1 preceding the MDCT processing section 15-1. Here, among the input audio signals composed of streams of audio sample signals, the n-th audio frame in the i-th sub-band (i = 0, 1, 2, 3) is referred to as “sub-band frame [ i] [n] ". In FIG. 4, the subband index i = 0. Further, the correction function calculation unit 14b is illustrated by 14b-a when calculating the correction function of the n-1th subband frame [i] [n-1], and is the nth subband frame [i] [ 14b-when calculating the correction function of
14b- when calculating the correction function of the n + 1th subband frame [i] [n + 1] illustrated in FIG.
Although shown by c, these are the same correction function calculation units 14b separately shown for convenience.

【0063】図4において、利得制御されるべきn番目
のサブバンドフレーム[i][n]は、修正関数を計算
するために、後続するサブバンドフレーム[i][n+
1]とともにバッファメモリ14aに格納される。修正
関数計算部14b−bは、2つのサブバンドフレーム
[i][n]及び[n+1]と、利得制御されたサブバ
ンドフレーム[i][n−1]のピーク値PrevFramePea
k[i]とに基づいてサブバンドフレーム[i][n]
のための修正関数MF[i][n]を計算し、次いで、
乗算器MP1bは上記修正関数MF[i][n]をサブ
バンドフレーム[i][n]に乗算して乗算結果のサブ
バンドフレーム[i][n]を縦続接続演算子CO1及
び乗算器MP2bに出力する。それとともに、乗算結果
のサブバンドフレーム[i][n]は、ピーク値PrevFr
amePeak[i]として次のサブバンドフレーム[i]
[n+1]の計算に用いるために、修正関数計算部14
b−cに送られる。また、修正関数計算部14b−a
は、サブバンドフレーム[i][n−1]及び[n]
と、利得制御されたサブバンドフレーム[i][n−
2]のピーク値PrevFramePeak[i]とに基づいてサブ
バンドフレーム[i][n−1]のための修正関数MF
[i][n−1]を計算し、次いで、乗算器MP1aは
上記修正関数MF[i][n−1]をサブバンドフレー
ム[i][n−1]に乗算して乗算結果のサブバンドフ
レーム[i][n−1]を乗算器MP2aに出力する。
それとともに、乗算結果のサブバンドフレーム[i]
[n−1]は、ピーク値PrevFramePeak[i]として次
のサブバンドフレーム[i][n]の計算に用いるため
に、修正関数計算部14b−bに送られる。さらに、同
様に、修正関数計算部14b−cは、サブバンドフレー
ム[i][n+1]及び[n+2]と、利得制御された
サブバンドフレーム[i][n]のピーク値PrevFrameP
eak[i]とに基づいてサブバンドフレーム[i][n
+1]のための修正関数MF[i][n+1]を計算
し、次いで、乗算器MP1cは上記修正関数MF[i]
[n+1]をサブバンドフレーム[i][n+1]に乗
算して乗算結果のサブバンドフレーム[i][n+1]
を縦続接続演算子CO2及び乗算器MP2cに出力す
る。
In FIG. 4, the nth sub-band frame [i] [n] to be gain controlled has the following sub-band frame [i] [n +] for calculating the correction function.
1] and stored in the buffer memory 14a. The correction function calculator 14b-b has two peak values PrevFramePea of the subband frames [i] [n] and [n + 1] and the gain-controlled subband frame [i] [n-1].
Subband frame [i] [n] based on k [i]
Compute a modified function MF [i] [n] for
The multiplier MP1b multiplies the modified function MF [i] [n] by the subband frame [i] [n] and multiplies the resulting subband frame [i] [n] by the cascade operator CO1 and the multiplier MP2b. Output to. At the same time, the sub-band frames [i] [n] resulting from the multiplication have peak values PrevFr.
The next subband frame [i] as amePeak [i]
The correction function calculator 14 is used to calculate [n + 1].
sent to bc. In addition, the correction function calculation unit 14b-a
Are subband frames [i] [n-1] and [n]
And gain-controlled subband frame [i] [n-
2] peak value PrevFramePeak [i] and the correction function MF for subband frame [i] [n-1]
[I] [n-1] is calculated, and then the multiplier MP1a multiplies the correction function MF [i] [n-1] by the sub-band frame [i] [n-1] to obtain the sub result of the multiplication. The band frame [i] [n-1] is output to the multiplier MP2a.
Along with that, the subband frame [i] of the multiplication result
[N-1] is sent to the correction function calculator 14b-b as a peak value PrevFramePeak [i] for use in the calculation of the next subband frame [i] [n]. Further, similarly, the correction function calculators 14b-c similarly determine the peak value PrevFrameP of the subband frames [i] [n + 1] and [n + 2] and the gain-controlled subband frame [i] [n].
Subband frame [i] [n] based on eak [i]
+1] for calculating the correction function MF [i] [n + 1], and the multiplier MP1c then calculates the correction function MF [i]
Subband frame [i] [n + 1] is obtained by multiplying [n + 1] by subband frame [i] [n + 1].
To the cascade connection operator CO2 and the multiplier MP2c.

【0064】MDCT処理部16−1における変形離散
コサイン変換(MDCT)処理に先行して、サブバンド
フレームの境界における修正関数の連続性を保証しなが
ら、2つの連続的なサブバンドフレームが互いに縦続接
続される。乗算器MP2aは、修正関数MF[i][n
−1]によって利得制御されて乗算器MP1aから出力
されたサブバンドフレーム[i][n−1]を、次のサ
ブバンドフレーム[i][n]のための修正関数MF
[i][n]の最初の区分(本実施形態において、区分
(パーティションとも呼ばれる。)とは、1つのサブバ
ンドフレームを32個の区分に分割したときの当該区分
をいう。)の利得係数(すなわち、修正関数値)MF
[i][n][0]と乗算することにより正規化して、
乗算結果のサブバンドフレーム[i][n−1]を縦続
接続演算子CO1に出力する。次いで、縦続接続演算子
CO1は、乗算器MP2aから出力されたサブバンドフ
レーム[i][n−1]と、乗算器MP1bから出力さ
れたサブバンドフレーム[i][n]とを縦続接続し
て、MDCT処理部16−1に出力する。同様に、乗算
器MP2bは、乗算器MP1aから出力されたサブバン
ドフレーム[i][n]を、次のサブバンドフレーム
[i][n+1]のための修正関数MF[i][n+
1]の最初の区分の利得係数MF[i][n+1]
[0]と乗算することにより正規化して、縦続接続演算
子CO2に出力する。次いで、縦続接続演算子CO2
は、乗算器MP2bから出力されたサブバンドフレーム
[i][n]と、乗算器MP1cから出力されたサブバ
ンドフレーム[i][n+1]とを縦続接続して、MD
CT処理部16−1に出力する。すなわち、ATRAC
3の標準は、修正関数MF[i][n]の値がサブバン
ドフレーム[i][n]の端点において1に等しい(す
なわち、利得が1である)ことを必要とし、そのため、
修正関数MF[i][n]が次の修正関数MF[i]
[n+1]と結合されたとき、それは、次の修正関数の
最初の区分の利得係数MF[i][n+1][0]との
乗算によって、サブバンドフレーム[i][n]及び
[n+1]の境界において同一のレベルにするように正
規化することができる。ゆえに、結合された2つのサブ
バンドフレームは、隣接するブロックがそれぞれ50%
の重複を有するMDCTのための変換ブロック全体を形
成した後、MDCT処理部16−1に出力される。
Prior to the modified discrete cosine transform (MDCT) processing in the MDCT processing unit 16-1, two continuous subband frames are cascaded with each other while guaranteeing the continuity of the correction function at the boundary of the subband frames. Connected. The multiplier MP2a uses the modification function MF [i] [n
−1] gain-controlled by the sub-band frame [i] [n−1] output from the multiplier MP1a, the correction function MF for the next sub-band frame [i] [n]
The gain coefficient of the first partition of [i] and [n] (in this embodiment, partition (also referred to as partition) means the partition when one subband frame is divided into 32 partitions). (That is, the correction function value) MF
Normalize by multiplying with [i] [n] [0],
The subband frame [i] [n-1] of the multiplication result is output to the cascade connection operator CO1. Then, the cascade operator CO1 cascade-connects the subband frame [i] [n-1] output from the multiplier MP2a and the subband frame [i] [n] output from the multiplier MP1b. And outputs it to the MDCT processing unit 16-1. Similarly, the multiplier MP2b modifies the subband frame [i] [n] output from the multiplier MP1a by a correction function MF [i] [n +] for the next subband frame [i] [n + 1].
1] first section gain coefficient MF [i] [n + 1]
It is normalized by being multiplied by [0] and output to the cascade connection operator CO2. Then, the cascade connection operator CO2
Connects the subband frame [i] [n] output from the multiplier MP2b and the subband frame [i] [n + 1] output from the multiplier MP1c in cascade connection, and
It is output to the CT processing unit 16-1. That is, ATRAC
The standard of 3 requires that the value of the modification function MF [i] [n] be equal to 1 (ie the gain is 1) at the endpoints of the subband frame [i] [n], so
The modification function MF [i] [n] is the next modification function MF [i]
When combined with [n + 1], it is multiplied by the gain factor MF [i] [n + 1] [0] of the first partition of the next correction function to produce subband frames [i] [n] and [n + 1]. Can be normalized to the same level at the boundaries of. Therefore, two sub-band frames that are combined have 50% adjacent blocks each.
After forming the entire transform block for MDCT having the overlap of, it is output to the MDCT processing unit 16-1.

【0065】図4を参照して以上に説明した乗算器MP
1a,MP1b,MP1c,MP2a,MP2b及びM
P2cと、縦続接続演算子CO1,CO2とは、本実施
形態においては、利得制御部15−1に含まれるように
構成されている。図4においては、第1のバンドに関す
る処理のみを図示しているが、第2乃至第4のバンドに
関する処理も同様に実行される。
The multiplier MP described above with reference to FIG.
1a, MP1b, MP1c, MP2a, MP2b and M
The P2c and the cascade connection operators CO1 and CO2 are configured to be included in the gain control unit 15-1 in the present embodiment. In FIG. 4, only the processing regarding the first band is illustrated, but the processing regarding the second to fourth bands is similarly executed.

【0066】再び図2を参照すると、MDCT処理部1
6−1は、1つの周波数帯域で利得制御され、かつMD
CT処理するための変換ブロックに縦続接続された少な
くとも2つのサブバンドフレーム毎の信号に対してそれ
ぞれ変形離散コサイン変換(MDCT)の処理を実行
し、その結果として生じるスペクトル情報信号をトーン
成分符号化器17−1に出力する。トーン成分符号化器
17−1は、トーン成分検出部、スケールファクタ処理
部及びビット割り当て部等を備えて構成され、MDCT
処理された情報信号からトーン成分信号と非トーン性の
スペクトル信号とを分離して、それぞれをトーン成分量
子化器18−1とスペクトル量子化器19−1に出力す
る。ここで、トーン成分量子化器18−1とスペクトル
量子化器19−1はトーン成分信号と非トーン性のスペ
クトル信号とに個別に符号化(量子化)の処理をする。
次いで、ビットストリームマルチプレクサ20は、ハフ
マン符号化器とマルチプレクサとを備えて構成され、ト
ーン成分量子化器18−1とスペクトル量子化器19−
1において符号化された信号を、複数個(例えば14
個)のハフマンテーブルを用いて圧縮し、次いで、トー
ン成分符号化器17−1乃至17−4におけるトーン成
分及びスペクトルの情報と、符号化された各トーン成分
と、符号化された各非トーン成分と、利得検出部14−
1乃至14−4から出力された修正関数のデータ(詳細
後述するように、サブバンドフレーム内の修正位置のデ
ータと、修正レベルに関するデータと、変化点の個数の
データとを含む。)を含み、ATRAC3標準に従うサ
イド情報とを多重化することにより、ATRAC3のビ
ットストリーム信号を得て出力する。
Referring again to FIG. 2, MDCT processing unit 1
6-1 is gain controlled in one frequency band, and MD
A modified discrete cosine transform (MDCT) process is performed on each signal of at least two sub-band frames cascade-connected to a transform block for CT processing, and the resulting spectrum information signal is tone component encoded. Output to the device 17-1. The tone component encoder 17-1 is configured to include a tone component detection unit, a scale factor processing unit, a bit allocation unit, etc.
The tone component signal and the non-tone spectrum signal are separated from the processed information signal and output to the tone component quantizer 18-1 and the spectrum quantizer 19-1. Here, the tone component quantizer 18-1 and the spectrum quantizer 19-1 individually perform encoding (quantization) processing on the tone component signal and the non-tone spectrum signal.
Next, the bit stream multiplexer 20 is configured to include a Huffman encoder and a multiplexer, and the tone component quantizer 18-1 and the spectrum quantizer 19-
A plurality of signals (for example, 14
, Huffman table, and then the tone component and spectral information in the tone component encoders 17-1 to 17-4, each encoded tone component, and each encoded non-tone. Component and gain detector 14-
The correction function data output from 1 to 14-4 (including the correction position data in the subband frame, the correction level data, and the change point number data, as will be described later in detail). , And side information according to the ATRAC3 standard are multiplexed to obtain and output a bitstream signal of ATRAC3.

【0067】図3は、図1のオーディオデコーダ6の詳
細構成を示すブロック図である。最初に、ビットストリ
ームデマルチプレクサ21は、ミニディスク4等の記録
媒体、又は伝送媒体から読み出された後復調されたAT
RAC3のビットストリーム信号を、各サブバンドごと
のトーン成分の符号列及びスペクトルの符号列(非トー
ン成分の符号列)と、修正関数のデータを含むサイド情
報とに分離する。次いで、トーン成分逆量子化器22−
1とスペクトル逆量子化器23−1はそれぞれ、各符号
列をスペクトル係数に復号化(逆量子化)し、トーン成
分復号化部24−1は分離され復号化されたトーン成分
信号と非トーン性のスペクトル信号とを合成する。ま
た、他のサブバンドにおけるトーン成分の符号列及びス
ペクトルの符号列についても同様である。次いで、逆M
DCT処理部25−1乃至25−4は、各周波数帯域ご
とに逆MDCTによって時間領域のサブバンドフレーム
を生成し、次いで、逆利得制御部26−1乃至26−4
は、ビットストリームデマルチプレクサ21から入力さ
れたサイド情報内の修正関数のデータに基づいて、各サ
ブバンドフレームに対して利得制御とは逆の修正関数で
逆利得制御し、すなわち、利得制御によって増幅された
部分を抑圧し、抑圧された部分を増幅し、逆利得制御さ
れた各バンドのサブバンドフレームをQMF合成フィル
タ27に出力する。最後に、QMF合成フィルタ27は
各バンド(周波数帯域)毎のサブバンドフレームを合成
して、合成されたディジタルオーディオ信号を出力す
る。
FIG. 3 is a block diagram showing the detailed structure of the audio decoder 6 shown in FIG. First, the bit stream demultiplexer 21 reads out from a recording medium such as a mini disk 4 or a transmission medium and then demodulates the AT.
The bitstream signal of the RAC3 is separated into a tone component code string and a spectrum code string (non-tone component code string) for each sub-band, and side information including correction function data. Then, the tone component dequantizer 22-
1 and the spectrum dequantizer 23-1 respectively decode (dequantize) each code string into spectrum coefficients, and the tone component decoding unit 24-1 separates and decodes the separated tone component signal and non-tone. And the spectral signal of sex. The same applies to the tone component code strings and spectrum code strings in other subbands. Then reverse M
The DCT processing units 25-1 to 25-4 generate time-domain subband frames by inverse MDCT for each frequency band, and then the inverse gain control units 26-1 to 26-4.
On the basis of the correction function data in the side information input from the bitstream demultiplexer 21, performs inverse gain control on each subband frame with a correction function opposite to the gain control, that is, amplifies by gain control. The suppressed part is suppressed, the suppressed part is amplified, and the sub-band frame of each band subjected to inverse gain control is output to the QMF synthesis filter 27. Finally, the QMF synthesis filter 27 synthesizes the sub-band frames for each band (frequency band) and outputs the synthesized digital audio signal.

【0068】以上説明したように、図1のミニディスク
記録再生システムは、オーディオ信号の符号化装置であ
るオーディオエンコーダ2とオーディオ信号の復号化装
置であるオーディオデコーダ6とを備えたオーディオ信
号の符号化及び復号化システムである。上記オーディオ
エンコーダ2は、入力されたオーディオ信号に基づいて
フレーム毎に修正関数を計算する利得検出部14と、計
算された修正関数に従って上記オーディオ信号に対して
利得制御する利得制御部15−1乃至15−4と、上記
利得制御されたオーディオ信号に対して、縦続接続され
た互いに隣接する2つのフレーム毎に直交変換処理を行
うMDCT処理部16−1乃至16−4と、上記直交変
換された信号に符号化処理を行うトーン成分符号化器1
7−1乃至17−4、トーン成分量子化器18−1乃至
18−4及びスペクトル量子化器19−1乃至19−4
を備えたことにより、符号化されたビットストリーム信
号を得る。また、上記オーディオデコーダ6は、上記オ
ーディオエンコーダ2により符号化されたビットストリ
ーム信号を復号化するトーン成分逆量子化器22−1乃
至22−4、スペクトル逆量子化器23−1乃至23−
4及びトーン成分復号化器24−1乃至24−4と、上
記復号化された信号に逆直交変換処理を行う逆MDCT
処理部25−1乃至25−4とを備えたことにより、複
数のフレームからなるオーディオ信号を得て、上記オー
ディオ信号の復号化装置はさらに、上記得られたオーデ
ィオ信号に対して、上記修正関数とは逆の修正関数を用
いて逆利得制御を行って逆利得制御されたオーディオ信
号を得て出力する逆利得制御部26−1乃至26−4と
を備えている。
As described above, the mini-disc recording / reproducing system of FIG. 1 has an audio signal code including the audio encoder 2 which is an audio signal encoding device and the audio decoder 6 which is an audio signal decoding device. It is an encryption and decryption system. The audio encoder 2 includes a gain detection unit 14 that calculates a correction function for each frame based on the input audio signal, and gain control units 15-1 to 15-1 that control the gain of the audio signal according to the calculated correction function. 15-4, the MDCT processing units 16-1 to 16-4 that perform an orthogonal transform process for every two adjacent frames that are connected in cascade with respect to the gain-controlled audio signal, and the orthogonal transform is performed. Tone component encoder 1 for encoding signals
7-1 to 17-4, tone component quantizers 18-1 to 18-4 and spectrum quantizers 19-1 to 19-4
By providing, the encoded bitstream signal is obtained. The audio decoder 6 also includes tone component dequantizers 22-1 to 22-4 and spectrum dequantizers 23-1 to 23- for decoding the bitstream signal encoded by the audio encoder 2.
4 and tone component decoders 24-1 to 24-4 and an inverse MDCT for performing an inverse orthogonal transform process on the decoded signal.
By including the processing units 25-1 to 25-4, an audio signal composed of a plurality of frames is obtained, and the audio signal decoding device further applies the correction function to the obtained audio signal. And inverse gain control sections 26-1 to 26-4 for performing inverse gain control using a correction function opposite to that for obtaining and outputting the inverse-gain-controlled audio signal.

【0069】本願明細書に開示する発明は、本願出願人
によって特願2001−188067号の特許出願にお
いて開示された「オーディオ信号の符号化方法及び装
置、並びに符号化及び復号化システム」と題する発明
(以下、「先願の発明」と呼ぶ。)から改善されかつ拡
張されたものである。先願の発明は計算面で経済的なも
のであるのに対して、本発明は、計算コストは上昇する
がそれに相応して優れた品質を提供する。2つの発明の
キーとなる相違点と、本発明において改善されかつ拡張
された改善拡張事項とを以下に列挙する。 (1)先願の発明は、アタック信号基準において、処理
すべき現在のサブバンドフレームに先行するサブバンド
フレームの最後の8個の区分の各最大値であるピーク値
MaxPeakを用いた。本発明は、先行するサブバンドフレ
ームの最大値である単一のピーク値PrevFramePeakを用
いる。 (2)先願の発明は、現在のサブバンドフレームに続く
未来のサブバンドフレームからの区分を一切利用しな
い。それは、現在のサブバンドフレームの最後の区分を
シフトして未来のサブバンドフレームの第1の区分を生
成することにより、フレーム間の境界におけるアタック
信号の問題(後述)に取り組んだ。上記未来のサブバン
ドフレームの第1の区分は、「擬似未来」区分と呼ばれ
た。本発明は、未来のサブバンドフレームの最初の8個
の区分の各最大値であるピーク値MaxPeakを利用する。 (3)先願の発明は、固定されたリリース信号基準を用
いた。本発明は可変なリリース信号基準を用いる。 (4)先願の発明は、利得制御すべき各修正ポイントに
対して、それらが発見されるたびに修正レベルを計算し
た。計算された新しい修正レベルはそれぞれ、当該サブ
バンドフレームの先行するすべての修正レベルに加算さ
れた。本発明は、すべての修正ポイントにマーキング
し、まずこれらに単に指標となる修正レベルを付与して
そのタイプ(「アタック信号」の立上がりの開始位置で
あるか、又は「リリース信号」の立下がりの終了位置で
あるか)を区別する。次いで、当該サブバンドフレーム
の望ましい信号レベルが計算される。最後に、上記望ま
しい信号レベルに基づいて修正レベルが計算される。 (5)本発明は、発話音声における信号強度の自然な遷
移(信号強度の緩やかな増大と緩やかな減少を含む。以
下、それらを「自然な上昇(ascent)」及び「自然な降
下(descent)」と呼ぶ。)をチェックするために特別
な基準を組み込み、上記自然な遷移に合わせて修正レベ
ルを調節する。先願の発明はこれを行わない。 (6)先願の発明は、利得制御された現在のサブバンド
フレームの信号レベルと利得制御された先行するサブバ
ンドフレームの信号レベルとが大幅に異なるか否かをチ
ェックしない。本発明はこれを実行し、適宜状況を矯正
する。 (7)本発明は、現在のサブバンドフレームの第1の区
分の修正レベルを制限して、先行するサブバンドフレー
ムの過度の減衰を防止する。先願の発明はこれを行わな
い。 (8)先願の発明は、利得制御された現在のサブバンド
フレームの終端が弱いか否かをチェックすることによる
ポストエコーの直接制御を行なわない。本発明はこれを
実行し、適宜状況を矯正する。
The invention disclosed in the present specification is an invention entitled "Audio signal encoding method and apparatus, and encoding and decoding system" disclosed in the patent application of Japanese Patent Application No. 2001-188067 by the present applicant. (Hereinafter, referred to as “the invention of the prior application”). While the invention of the prior application is computationally economical, the invention provides correspondingly superior quality at the expense of computational cost. The key differences between the two inventions and the improvements and enhancements that have been improved and expanded in the present invention are listed below. (1) The invention of the prior application is the peak value which is the maximum value of each of the last eight sections of the subband frame preceding the current subband frame to be processed in the attack signal standard.
Max Peak was used. The present invention uses a single peak value PrevFramePeak that is the maximum of the preceding subband frame. (2) The invention of the prior application does not use any division from the future subband frame following the current subband frame. It addressed the problem of attack signals at inter-frame boundaries (discussed below) by shifting the last partition of the current subband frame to produce the first partition of the future subband frame. The first section of the future subband frame was called the "pseudo future" section. The present invention utilizes the peak value MaxPeak, which is the maximum value of each of the first eight sections of the future subband frame. (3) The invention of the prior application used a fixed release signal reference. The present invention uses a variable release signal reference. (4) In the invention of the prior application, for each correction point to be gain controlled, the correction level was calculated each time they were found. Each new correction level calculated was added to all previous correction levels of the subband frame in question. The present invention marks all the correction points and first gives them a correction level that is merely an indicator to determine the type (either the start position of the rising edge of the "attack signal" or the falling edge of the "release signal"). End position). The desired signal level for that subband frame is then calculated. Finally, a correction level is calculated based on the desired signal level. (5) The present invention includes natural transitions of signal strength in uttered speech (including a gradual increase and a gradual decrease in signal strength. Hereinafter, those are referred to as "natural ascent" and "natural descent". ".") And incorporate a special criterion to adjust the correction level to the natural transition. The invention of the earlier application does not do this. (6) The invention of the prior application does not check whether the signal level of the current gain-controlled subband frame and the signal level of the preceding gain-controlled subband frame are significantly different. The present invention does this and corrects the situation as appropriate. (7) The present invention limits the modification level of the first partition of the current subband frame to prevent excessive attenuation of the preceding subband frame. The invention of the earlier application does not do this. (8) The invention of the prior application does not directly control the post echo by checking whether or not the end of the current subband frame whose gain is controlled is weak. The present invention does this and corrects the situation as appropriate.

【0070】以下、本発明の実施形態に係る修正関数計
算方法の特徴について説明する。修正関数の生成は、A
TRAC3標準の仕様に準じる。入力信号のスペクトル
成分である各サブバンドの256個のオーディオサンプ
ル信号は、32個の区分(パーティション)に分割さ
れ、そのそれぞれは8個の連続するオーディオサンプル
信号でまとめられている。サブバンドフレーム内の任意
の区分において、利得制御されることを必要とする修正
ポイントとして、アタック信号の立上がりの開始位置
(以下、「アタックポイント」と呼ぶ。)か、又はリリ
ース信号の立下がりの終了位置(以下、「リリースポイ
ント」と呼ぶ。)を、その変数を具体化することによっ
て決定することができる。図5は、変数を決定すること
によるいくつかの修正ポイントの具体化と、修正関数M
F[i][n]の生成とを示したものである。adjust_n
um[i]は、サブバンドiのサブバンドフレームの修正
ポイントの総数として定義され、この場合は、adjust_n
um[i]=4である。修正位置aloccode[i][j]
は、サブバンドiのサブバンドフレームにおけるj番目
の修正ポイント(図5の例では、j=0,1,…,adju
st_num[i]−1、すなわち3まで)の区分のインデッ
クス(0,1,…,31)である。修正レベルalevcode
[i][j]は、修正位置aloccode[i][j]に対応
する修正ポイントの修正の大きさを表す利得係数であ
り、2のべき乗のべき指数を意味する。ATRAC3標
準が修正ポイント数adjust_num[i]、修正位置alocco
de[i][j]及び修正レベルalevcode[i][j]に
対して割り当てたビット数はそれぞれ、3,5及び4で
ある。
The features of the correction function calculation method according to the embodiment of the present invention will be described below. The generation of the correction function is A
According to the specifications of TRAC3 standard. The 256 audio sample signals of each sub-band, which are spectral components of the input signal, are divided into 32 partitions, each of which is grouped into 8 consecutive audio sample signals. In any section in the subband frame, as a correction point that needs to be gain-controlled, the start position of the rising edge of the attack signal (hereinafter referred to as "attack point") or the falling edge of the release signal. The end position (hereinafter referred to as the "release point") can be determined by instantiating that variable. FIG. 5 shows the implementation of some modification points by determining variables and the modification function M
9 shows the generation of F [i] [n]. adjust_n
um [i] is defined as the total number of correction points in the subband frame of subband i, in this case adjust_n
um [i] = 4. Correction position aloccode [i] [j]
Is the j-th correction point in the subband frame of subband i (j = 0, 1, ..., Adju in the example of FIG. 5).
It is an index (0, 1, ..., 31) of a section of st_num [i] -1, that is, up to 3. Modification level alevcode
[I] [j] is a gain coefficient representing the magnitude of modification of the modification point corresponding to the modification position aloccode [i] [j], and means a power of 2 to a power. The ATRAC3 standard is the number of correction points adjust_num [i], the correction position alocco
The number of bits assigned to de [i] [j] and the modification level alevcode [i] [j] are 3, 5 and 4, respectively.

【0071】アタック信号が検出されたとき、それの修
正ポイント(アタックポイント)として、信号の振幅が
急激に増大する区分の位置をマーキングし、先行する修
正ポイントから当該アタックポイントまでの相対的に小
さい振幅の部分を増幅する。それに対して、リリース信
号が検出されたとき、それの修正ポイント(リリースポ
イント)として、信号の振幅が急激に減少した後の、小
さい振幅が続く部分の最初の区分の位置をマーキング
し、先行する修正ポイントから当該リリースポイントま
での相対的に大きい振幅の部分が減衰される。ATRA
C3標準によれば、修正レベルalevcode[i][j]は
すべて正の整数であり、4の値が「利得制御なし」に対
応するように定義されているので、オーディオサンプル
信号に実際に適用される修正レベル、すなわち増幅又は
減衰の大きさは2(alevcode[i] [j]−4)である。
また、2つの異なる修正レベルの間は対数的に遷移す
る。
When an attack signal is detected, the position of a section where the amplitude of the signal sharply increases is marked as a correction point (attack point) of the attack signal, and it is relatively small from the preceding correction point to the attack point. Amplify the amplitude part. On the other hand, when a release signal is detected, as a correction point (release point) for the release signal, the position of the first section of the portion where the small amplitude continues after the signal amplitude suddenly decreases is marked and preceded. A portion having a relatively large amplitude from the correction point to the release point is attenuated. ATRA
According to the C3 standard, the modification levels alevcode [i] [j] are all positive integers, and the value of 4 is defined to correspond to "no gain control", so it is actually applied to audio sample signals. The correction level applied, ie the magnitude of the amplification or attenuation, is 2 (alevcode [i] [j] -4) .
Also, there is a logarithmic transition between the two different modification levels.

【0072】例えば、図5を参照すると、最初の修正ポ
イント(adjust_num[i]=0)は、修正位置aloccode
[i][0]=4及び修正レベルalevcode[i][0]
=5を有するアタックポイントであり、かつ、この最初
の修正ポイントについては、その効果がサブバンドフレ
ームの先頭部分にまで及ぶように修正関数が延長されて
いる。従って、この修正ポイントに対して、第1の区分
(本実施形態では、0番目の区分として表記される。)
から第4の区分(本実施形態では、3番目の区分として
表記される。)までの振幅が、2倍だけ増幅される。同
様に、第2の修正ポイント(adjust_num[i]=1)
は、修正位置aloccode[i][1]=13及び修正レベ
ルalevcode[i][1]=2を有するリリースポイント
であり、この修正レベルは、先行する第1の修正ポイン
トと当該第2の修正ポイントとの間の区分に作用するの
で、この修正ポイントに対して、第6の区分から第13
の区分までの振幅が、2−2倍だけ増幅、すなわち4分
の1に減衰される。また、第4の修正ポイント(adjust
_num[i]=3)の後の最後の修正ポイントでは、修正
レベルを1にする必要がある。1のレベルにする理由
は、図4で説明されたように、次のサブバンドフレーム
の修正関数MF[i][n+1]との結合を容易にする
ことにあり、これによって、修正関数の連続性は、修正
関数MF[i][n]の全体に修正関数MF[i][n
+1]に係る第1の区分の修正関数値(すなわち修正レ
ベル)を乗算することによって容易に達成することがで
きる。
For example, referring to FIG. 5, the first correction point (adjust_num [i] = 0) is the correction position aloccode.
[I] [0] = 4 and modification level alevcode [i] [0]
= 5 attack points, and for this first modification point, the modification function is extended so that its effect extends to the beginning of the subband frame. Therefore, with respect to this correction point, the first division (in the present embodiment, described as the 0th division).
To the fourth section (in the present embodiment, described as the third section), the amplitude is amplified by a factor of two. Similarly, the second correction point (adjust_num [i] = 1)
Is a release point having a modification position aloccode [i] [1] = 13 and a modification level alevcode [i] [1] = 2, which modification level corresponds to the preceding first modification point and the second modification. Since it affects the section between the point and the point, for this correction point,
The amplitude up to the section is amplified by 2 −2 times, that is, attenuated to 1/4. In addition, the fourth correction point (adjust
At the last modification point after _num [i] = 3), the modification level needs to be 1. The reason for setting the level to 1 is to facilitate the combination with the correction function MF [i] [n + 1] of the next subband frame, as described in FIG. The property is that the correction function MF [i] [n]
This can easily be achieved by multiplying by the correction function value (ie the correction level) of the first section for [+1].

【0073】従って、修正関数計算部14bは、アタッ
ク信号の開始位置を含む区分と、当該アタック信号の開
始位置を含む区分に先行する修正ポイントとの間の各区
分に係る修正関数値を、当該アタック信号の開始位置を
含む区分と、上記先行する修正ポイントとの間における
最大のピークの絶対値InterModMaxPeak[i][j]
が、所定の目標ピーク値CurrFramePeak[i]に等しく
なるように計算し、また、リリース信号の開始位置を含
む区分と、当該リリース信号の開始位置を含む区分に先
行する修正ポイントとの間の各区分に係る修正関数値
を、当該リリース信号の開始位置を含む区分と、上記先
行する修正ポイントとの間における最大のピークの絶対
値InterModMaxPeak[i][j]が、上記目標ピーク値C
urrFramePeak[i]に等しくなるように計算することを
特徴とする。以上のような修正関数値を計算する処理
は、後述のフローチャートでは、図12のステップS2
3の修正レベルalevcode計算処理で実行される。
Therefore, the correction function calculation unit 14b determines the correction function value for each section between the section including the start position of the attack signal and the correction point preceding the section including the start position of the attack signal. Absolute value InterMaxMaxPeak [i] [j] of the maximum peak between the segment including the start position of the attack signal and the preceding correction point
Is calculated so as to be equal to a predetermined target peak value CurrFramePeak [i], and each of between the section including the start position of the release signal and the correction point preceding the section including the start position of the release signal. As for the correction function value related to the division, the absolute value InterModMaxPeak [i] [j] of the maximum peak between the division including the start position of the release signal and the preceding correction point is the target peak value C.
The calculation is performed so as to be equal to urrFramePeak [i]. The process of calculating the correction function value as described above is performed in step S2 of FIG.
It is executed in the modification level alevcode calculation processing of 3.

【0074】オーディオ符号化はサブバンドフレーム毎
の基準で実行されるので、サブバンドフレームの先頭部
分で発生する信号のアタック信号は、利得制御が先行す
るサブバンドフレームに適用されるときのみ、取り扱う
ことができる。これは、「境界アタック信号」問題とし
て知られ、「現在の」サブバンドフレームが処理されて
いるとき「未来の」サブバンドフレームの第1の区分に
おけるアタック信号に対して測定が実行されるように、
余分なサブバンドフレームのバッファリングを必要とす
る。本発明は、リリースのより効果的な検出のために、
未来のサブバンドフレームの最初の8個の区分を利用す
る。アタック信号及びリリース信号の検出は、サブバン
ドフレームの最初(0番目)の区分から最後(31番
目)の区分まで実行される。
Since audio encoding is performed on a subband-frame-by-subband basis, the attack signal of the signal that occurs at the beginning of a subband frame is only handled when gain control is applied to the preceding subband frame. be able to. This is known as the "boundary attack signal" problem, so that when the "current" subband frame is being processed, measurements are performed on the attack signal in the first section of the "future" subband frame. To
Requires extra subband frame buffering. The present invention provides for more effective detection of releases,
Utilize the first eight partitions of future subband frames. The detection of the attack signal and the release signal is executed from the first (0th) section to the last (31st) section of the subband frame.

【0075】ある区分においてアタック信号の立上がり
の開始位置を検出するために、当該区分内のオーディオ
サンプル信号のピークの絶対値である区分のピーク値Ma
xPeakは、それに先行する8個の区分のピーク値MaxPeak
のそれぞれと比較される。当該区分のピーク値MaxPeak
は、先行する8個の区分の最大のピーク値MaxPeakを予
め決められたしきい値の比(本実施形態では2)だけ上
回るときのみ、アタック信号として分類される。当該区
分がサブバンドフレームの先頭部分の近くでありかつこ
れに先行して存在する区分が8個に満たないときは、現
在のサブバンドフレームに先行し、すでに利得制御され
たサブバンドフレームのピークの絶対値(ピーク値Prev
FramePeak[i])を考慮する必要がある。比の要件が
満たされていれば、先行するアタックポイントからの区
分の分離距離(分離区分数)が十分に大きい場合にの
み、当該区分は有効なアタックポイントであるものとさ
れる。これは、非常に微細なスケールで利得制御する利
益よりも、量子化のためにより多くのビットを残してお
く利益のほうが重要なためである。本実施形態では、1
区分の分離距離を採用している。
In order to detect the rising position of the attack signal in a certain section, the peak value Ma of the section, which is the absolute value of the peak of the audio sample signal in the section, is detected.
xPeak is the peak value MaxPeak of the eight sections preceding it
Compared to each. Peak value of the category MaxPeak
Is classified as an attack signal only when the maximum peak value MaxPeak of the preceding eight segments is exceeded by a predetermined threshold ratio (2 in this embodiment). If the partition is near the beginning of the subband frame and less than eight partitions exist prior to this, the peak of the subband frame that has preceded the current subband frame and has already been gain controlled Absolute value of (peak value Prev
FramePeak [i]) needs to be considered. If the ratio requirement is met, then a segment is considered to be a valid attack point only if the separation distance of the segment from the preceding attack point (separation segment number) is sufficiently large. This is because the benefit of leaving more bits for quantization is more important than the benefit of gain control on a very fine scale. In this embodiment, 1
The separation distance of the division is adopted.

【0076】一般にアタック信号に後続して存在するリ
リース信号を検出するために、現在の区分の前の最後の
修正ポイントと現在の区分との間の最大のピーク値MaxP
eakであるInterModMaxPeak[i][j]が、現在の区分
以後の8個の区分の最大のピーク値MaxPeakをしきい値
の比だけ超過している必要がある。しきい値は、先行す
る修正ポイントがアタックポイントであるかリリースポ
イントであるかに依存して変化する。先行する修正ポイ
ントがアタックポイントであれば、より大きいしきい値
(本実施形態では、減衰係数attn_ftr=4)が使用さ
れ、リリースポイントであれば、より小さいしきい値
(本実施形態では、減衰係数attn_ftr=3)が使用され
る。図6が示すように、リリース信号は、アタック信号
とは異なり、最初により急激な勾配で発生し、その後す
ぐに、わずかにより緩やかなレートになる傾向がある。
可変なしきい値は、リリース信号を、異なるレベルの利
得制御を適用可能な複数の領域へとより効果的に分割
(セグメント化)できる。結果として、ポストエコーは
より良好に抑圧される。
In order to detect the release signal, which generally follows the attack signal, the maximum peak value MaxP between the last correction point before the current segment and the current segment.
InterModMaxPeak [i] [j], which is an eak, needs to exceed the maximum peak value MaxPeak of the eight partitions after the current partition by a threshold ratio. The threshold value changes depending on whether the preceding correction point is an attack point or a release point. If the preceding correction point is an attack point, a larger threshold value (in the present embodiment, a damping coefficient attn_ftr = 4) is used, and if it is a release point, a smaller threshold value (in the present embodiment, a damping coefficient). The coefficient attn_ftr = 3) is used. As FIG. 6 shows, the release signal, unlike the attack signal, tends to occur with a steeper slope first and then sooner to a slightly slower rate.
The variable threshold can more effectively divide (segment) the release signal into regions where different levels of gain control can be applied. As a result, post-echo is better suppressed.

【0077】すべてのアタックポイントに対して、その
指標(又は、マーカー)として1の値が修正レベルalev
code[i][j]に割り当てられる。すべてのリリース
ポイントに関して、それに先行するピーク値InterModMa
xPeak[i][j]の大きさを示す負の値が、修正レベ
ルalevcode[i][j]に指標として割り当てられる。
ここで割り当てられた修正レベルalevcode[i][j]
は、実際に利得制御を行うための値ではない。
A value of 1 as the index (or marker) for all attack points is the correction level alev
It is assigned to code [i] [j]. Preceding peak value InterModMa for all release points
A negative value indicating the magnitude of xPeak [i] [j] is assigned to the modification level alevcode [i] [j] as an index.
Modification level assigned here alevcode [i] [j]
Is not a value for actually performing gain control.

【0078】最後(31番目)の区分が処理された後
で、先に発見されたすべての修正レベルに基づいて、目
標ピーク値CurrFramePeak[i]が計算される。これ
は、現在のフレームの修正ポイント間のすべての信号領
域が増幅され、又は減衰される目標となる「望ましい」
信号レベルである。
After the last (31st) segment has been processed, the target peak value CurrFramePeak [i] is calculated based on all previously discovered correction levels. This is the desired "desirable" target where all signal areas between the correction points of the current frame are amplified or attenuated.
The signal level.

【0079】実際の修正レベルが計算される前に、信号
は、「自然な降下」について、すなわち信号強度が発話
音声に特有の自然な減衰(フェージング)の徴候を有す
るか否かについてチェックされる。先行するサブバンド
フレームがアタックの徴候をほとんど示さない、もしく
は全く示さず、かつ現在のサブバンドフレームの修正ポ
イントがリリースポイントのみで構成されているとき
は、これは「自然な降下」として分類される。有効な
「自然な降下」については、すべてのリリースポイント
が除去される。
Before the actual correction level is calculated, the signal is checked for "natural descent", ie, whether the signal strength has the signs of natural attenuation (fading) typical of spoken speech. . If the preceding subband frame shows little or no sign of attack, and the modification point of the current subband frame consists only of the release point, this is classified as a "natural descent". It For effective "natural descent" all release points are removed.

【0080】次に、先に割り当てられた「指標となる」
修正レベルに対して、実際の修正レベルalevcode[i]
[j]が、目標ピーク値CurrFramePeak[i]を用いて
すべての修正ポイントについて計算される。従って、修
正関数計算部14bは、オーディオ信号に基づいて、急
激な音の立上がりを含む信号の部分であるアタック信号
の開始位置を含む区分を修正ポイントとして識別し、オ
ーディオ信号に基づいて、急激な音の立下がりを含む信
号の部分であるリリース信号の終了位置を含む区分を修
正ポイントとして識別し、オーディオ信号に基づいて、
修正関数に従って利得制御したときに所望される、処理
すべき現在のフレームにおける目標ピーク値を計算し、
識別されたアタック信号の開始位置を含む区分と、識別
されたリリース信号の終了位置を含む区分と、計算され
た目標ピーク値とに基づいて、当該現在のフレームの各
区分に係る修正関数値からなる修正関数を計算すること
を特徴とする。
Next, the “index” assigned previously
Actual modification level alevcode [i] against modification level
[J] is calculated for all correction points using the target peak value CurrFramePeak [i]. Therefore, the correction function calculation unit 14b identifies, as the correction point, a section including the start position of the attack signal, which is a portion of the signal including a sharp rise of the sound, based on the audio signal, and based on the audio signal, The section including the end position of the release signal, which is the portion of the signal including the fall of the sound, is identified as the correction point, and based on the audio signal,
Calculating the target peak value in the current frame to be processed, which is desired when gain control is performed according to the correction function,
Based on the segment containing the start position of the identified attack signal, the segment containing the end position of the identified release signal, and the calculated target peak value, from the correction function value for each segment of the current frame It is characterized in that a correction function is calculated.

【0081】信号が、発話音声に特有の「自然な上昇」
を示すとき、すなわち信号強度が次第に増大するとき、
アタックポイントの修正レベルが調節される。図7
(a)が示すように、信号の振幅がゆっくりと増大して
いるときは、信号がピークに到達する区分は先行するア
タックポイントから十分に分離されている。このような
発話音声に特有の特徴を有する信号に対して計算された
修正レベル(増幅)をそのまま適用すると、図7(b)
のようにアーティファクトを発生させることがある。従
って、有効な「自然な上昇」が存在するならば、本実施
形態の処理では修正レベルalevcode[i][j]を1だ
け減少する(図7(c))。本実施形態で、アタック信
号が「自然な上昇」として分類されるためには、修正位
置aloccode[i][j]と、その後のピーク位置InterM
odMaxLoc[i][j+1]との間に5個の区分だけの分
離距離が必要である。
The signal is a "natural rise" peculiar to the speech voice.
, That is, when the signal strength gradually increases,
The correction level of the attack point is adjusted. Figure 7
As shown in (a), when the amplitude of the signal is slowly increasing, the segment where the signal reaches the peak is well separated from the preceding attack point. If the correction level (amplification) calculated for the signal having the characteristic feature of the uttered voice is applied as it is, FIG.
May cause artifacts like. Therefore, if there is an effective “natural increase”, the modification level alevcode [i] [j] is decreased by 1 in the processing of this embodiment (FIG. 7 (c)). In this embodiment, in order to classify the attack signal as “natural rise”, the correction position aloccode [i] [j] and the subsequent peak position InterM
A separation distance of only 5 partitions is required between odMaxLoc [i] [j + 1].

【0082】現在のサブバンドフレームは、MDCTの
ために、先行するサブバンドフレーム及び後続するサブ
バンドフレームとそれぞれ縦続接続されるので、目標ピ
ーク値CurrFramePeak[i]で示すことができる利得制
御された現在のサブバンドフレームの信号強度は、ピー
ク値PrevFramePeak[i]で示される利得制御された先
行するサブバンドフレームの信号強度と同等である必要
がある。一方の値が他方の値よりはるかに大きい場合
は、現在のサブバンドフレームの第1の区分に特別な修
正ポイントが導入される。例外的に、両方のサブバンド
フレームに利得制御が実行されないときは上述の修正は
実行されず、このような場合は、2つのサブバンドフレ
ームの信号レベルの差分が「自然」であるとされる。
The current sub-band frame is cascade-connected to the preceding sub-band frame and the succeeding sub-band frame, respectively, for MDCT, so that the gain control can be performed by the target peak value CurrFramePeak [i]. The signal strength of the current subband frame needs to be equivalent to the signal strength of the gain-controlled preceding subband frame indicated by the peak value PrevFramePeak [i]. If one value is much larger than the other, a special correction point is introduced in the first partition of the current subband frame. Exceptionally, the above modification is not performed when gain control is not performed on both subband frames, in which case the difference between the signal levels of the two subband frames is said to be "natural". .

【0083】各サブバンドフレームに対する修正関数の
第1の区分に係る修正レベル(図4では修正関数値MF
[i][n][0]で示されている。)は、先行するサ
ブバンドフレーム全体にも及ぶので、これは先行するサ
ブバンドフレームへの過度の減衰を引き起こすものであ
ってはならない。ゆえに、基準に適合させるために他の
修正レベルに適用される通常のクリッピング測定に加え
て、第1の区分の修正レベルは、先行するサブバンドフ
レームのすべてのアタックポイントにおける最小の修正
レベルから導出されるさらなるクリッピングを受ける。
The correction level (correction function value MF in FIG. 4) relating to the first section of the correction function for each subband frame.
It is indicated by [i] [n] [0]. ) Also spans the entire preceding subband frame, so it should not cause excessive attenuation to the preceding subband frame. Therefore, in addition to the usual clipping measurements applied to other modification levels to meet the criteria, the modification level of the first partition is derived from the minimum modification level at all attack points of the preceding subband frame. Subject to further clipping.

【0084】各修正ポイントに対する修正レベルalevco
de[i][j]は、その修正ポイントの修正位置alocco
de[i][j]と先行する修正ポイントの修正位置aloc
code[i][j−1]との間の信号のみを修正するの
で、最後の修正ポイントよりも時間的に後の信号は、利
得制御を要する場合であっても修正されないまま利得制
御部15−1乃至15−4から出力されてしまうことが
考えられる(図8(a),(b))。実際に、これは、
ポストエコーの非常に一般的な原因である。この問題を
回避するために、最後の修正ポイント以後のすべての区
分における最大のピーク値MaxPeakが、目標ピーク値Cur
rFramePeak[i]の大きさに照らしてチェックされ、著
しい差が存在する場合は、図8(c)のように最後の区
分に新しい修正ポイントが導入される。
Modification level alevco for each modification point
de [i] [j] is the correction position alocco of the correction point
Correction position aloc of the correction point preceding de [i] [j]
Since only the signal between code [i] [j-1] is modified, the signal temporally after the last modification point remains unmodified even if gain control is required, and the gain control unit 15 It is considered that the data is output from -1 to 15-4 (FIGS. 8A and 8B). In fact, this is
It is a very common cause of post echo. To avoid this problem, the maximum peak value MaxPeak in all sections since the last modification point is set to the target peak value Cur.
If checked against the magnitude of rFramePeak [i] and there is a significant difference, then a new correction point is introduced in the last partition, as in FIG. 8 (c).

【0085】以下、本発明の実施形態に係る修正関数計
算方法を、ATRAC3の利得制御方法を実施例として
用いて説明するが、本方法は、他の利得制御方法に係る
利得制御処理を実行する符号化器にも一般化することが
できる。図9乃至図18は、図2の修正関数計算部14
bによって実行される修正関数計算処理のフローチャー
トを示している。
Hereinafter, the correction function calculation method according to the embodiment of the present invention will be described by using the gain control method of the ATRAC3 as an example, but this method executes the gain control processing according to another gain control method. It can also be generalized to encoders. 9 to 18 show the correction function calculation unit 14 of FIG.
The flowchart of the correction function calculation process performed by b is shown.

【0086】図9のステップS1において、まず、バッ
ファメモリ14aから、次に処理すべき処理対象のサブ
バンドフレームの区分とそれに後続するサブバンドフレ
ームの最初の8個の区分とを含む2つのサブバンドフレ
ームの区分のサンプル信号を読み出して、すでに利得制
御された先行するサブバンドフレームのピーク値PrevFr
amePeak[i]とともに、上記処理対象のサブバンドフ
レームのための修正関数を計算するために用いるサブバ
ンドフレームのデータとする。なお、バッファメモリ1
4aには、フィルタバンク13−1乃至13−4から符
号化すべきオーディオサンプル信号が順次時系列で入力
されて格納されているものとする。次いで、ステップS
2において、メインループを開始させるために、iをサ
ブバンドのインデックスとして初期化する。インデック
スiは図13のステップS32でインクリメントされ、
処理は、ステップS33で決定されるように、インデッ
クスiがサブバンド数max_bandを超過するまで反復され
る。サブバンド数max_bandは、オーディオエンコーダ2
が利得制御を適用しようとするサブバンドi(i=0,
1,2,3)の最大の数(すなわち3)を示す。
In step S1 in FIG. 9, first, from the buffer memory 14a, two sub-segments including a section of a sub-band frame to be processed next and the first eight sections of subsequent sub-band frames are processed. Read the sampled signal of the band frame section to obtain the peak value PrevFr of the preceding sub-band frame that has already been gain controlled.
Together with amePeak [i], it is the data of the subband frame used to calculate the correction function for the subband frame to be processed. The buffer memory 1
It is assumed that the audio sample signals to be encoded from the filter banks 13-1 to 13-4 are sequentially input and stored in time series in 4a. Then, step S
At 2, i is initialized as a subband index to start the main loop. The index i is incremented in step S32 of FIG.
The process is repeated until the index i exceeds the number of subbands max_band, as determined in step S33. The number of subbands max_band is audio encoder 2
Is to apply the gain control to subband i (i = 0,
1, 2, 3) is the maximum number (ie 3).

【0087】ステップS3は初期化処理である。詳しく
は、図14のサブルーチンを参照すると、まずステップ
S41において、先行するサブバンドフレームの修正ポ
イント数prev_adjust_num[i]を決定するための条件
をチェックする。これは、同一のサブバンドiの先行す
るサブバンドフレームにおいて、修正が存在したか否か
の標識である。先行するサブバンドフレームの修正ポイ
ント数adjust_num[i]が0であるか、もしくはただ1
つの修正ポイントが存在しかつこれが先行するサブバン
ドフレームのまさに先頭部分で発生しているときは(本
実施形態では、サブバンドフレームの最初の3つの区分
のうちのいずれか;aloccode[i][0]<3)、ステ
ップS42において、これは0に設定される。前述の条
件が満たされていない場合は、修正ポイント数prev_adj
ust_num[i]は、ステップS43で、先行するサブバ
ンドフレームの修正ポイント数adjust_num[i]に設定
される。
Step S3 is an initialization process. Specifically, referring to the subroutine of FIG. 14, first, in step S41, the condition for determining the number of correction points prev_adjust_num [i] of the preceding subband frame is checked. This is an indicator of whether there was a modification in the preceding subband frame of the same subband i. The number of adjustment points adjust_num [i] of the preceding sub-band frame is 0, or only 1
If there are two correction points and they occur at the very beginning of the preceding subband frame (in this embodiment, one of the first three subband segments; aloccode [i] [ 0] <3), this is set to 0 in step S42. If the above conditions are not met, the number of correction points prev_adj
ust_num [i] is set to the number of adjustment points adjust_num [i] of the preceding subband frame in step S43.

【0088】ステップS44は、修正位置aloccode
[i][k]及び修正レベルalevcode[i][k]を初
期化する。本発明は、ATRAC3標準に許容される最
大値(7個)を超過した中間の修正ポイントを発生させ
ることがあるので、これらの中間のデータに記憶装置を
割り当てることが重要である。本実施形態の修正関数計
算処理では、20個の中間の修正ポイントが許容されて
いて、同一の修正レベルを割り当てられている互いに隣
接した修正ポイントの統合(ステップS24)の後でも
なお、標準よりも多く発生された中間の修正ポイントが
存在するときは、ステップS25で、検出された中間の
修正ポイントを削減して、ATRAC3標準に従う最終
的な修正ポイントのデータとする。
The step S44 is a correction position aloccode.
Initialize [i] [k] and modification level alevcode [i] [k]. It is important to allocate storage for these intermediate data, as the present invention may generate intermediate correction points that exceed the maximum allowed by the ATRAC3 standard (7). In the correction function calculation process of the present embodiment, 20 intermediate correction points are allowed, and even after the integration of adjacent correction points (step S24) to which the same correction level is assigned, it is still higher than the standard. If there are a lot of intermediate correction points, the detected intermediate correction points are reduced in step S25 to obtain final correction point data according to the ATRAC3 standard.

【0089】ステップS45において、入力信号のスペ
クトル成分のうちの1つであって、256個のオーディ
オサンプル信号にてなるサブバンドiのサブバンドフレ
ームから、0≦k<40のkに対して(k×8)番目か
ら始まる8個の連続するオーディオサンプル信号におけ
る最大の絶対値として定義されるピーク値MaxPeak
[i][k]を発生させる。31<k<40であれば、
ピーク値MaxPeak[i][k]は、未来のサブバンドフ
レームにおける、(k−32)×8番目から始まる8個
の連続するオーディオサンプル信号から取得される。こ
のように分割された「8個の連続するオーディオサンプ
ル信号」は、サブバンドフレームの「k番目の区分」を
構成し、従って、ピーク値MaxPeak[i][k]を区分
のピーク値と呼ぶ。
In step S45, from one of the spectral components of the input signal, a subband frame of subband i consisting of 256 audio sample signals, for k of 0≤k <40 ( Peak value MaxPeak defined as the maximum absolute value in 8 consecutive audio sample signals starting from the (k × 8) th
Generate [i] [k]. If 31 <k <40,
The peak value MaxPeak [i] [k] is obtained from eight consecutive audio sample signals starting from (k−32) × 8th in the future subband frame. The “8 consecutive audio sample signals” thus divided constitute the “kth division” of the subband frame, and thus the peak value MaxPeak [i] [k] is called the peak value of the division. .

【0090】ステップS46は、3つの変数をリセット
する。修正ポイント数adjust_num[i]は、サブバンド
iのサブバンドフレームで発見される修正ポイントの総
数である。ピーク値InterModMaxPeak[i][k]は、
ステップS5乃至S19のループにおいて各区分を順次
に調べている間は、現在の区分と(k−1)番目の修正
ポイントとの間の期間における最大のピーク値MaxPeak
として定義され、また、上記ループが終了した後の目標
ピーク値CurrFramePeak計算処理(ステップS22)で
は、互いに隣接する各修正ポイント間の最大のピーク値
MaxPeakとみなされる。ピーク位置InterModMaxLoc
[i][k]は、上記最大のピーク値InterModMaxPeak
[i][k]が位置している区分のインデックスであ
る。
A step S46 resets the three variables. The number of correction points adjust_num [i] is the total number of correction points found in the subband frame of subband i. The peak value InterModMaxPeak [i] [k] is
While sequentially examining each segment in the loop of steps S5 to S19, the maximum peak value MaxPeak in the period between the current segment and the (k-1) th correction point
In the target peak value CurrFramePeak calculation process (step S22) after the loop is finished, the maximum peak value between the correction points adjacent to each other is defined as
Considered as MaxPeak. Peak position InterModMaxLoc
[I] [k] are the maximum peak values InterModMaxPeak
[I] [k] is the index of the segment in which it is located.

【0091】再び図9を参照し、ステップS4は、フロ
ーの内部ループを開始させる。このループは、「区分の
インデックス」jで反復される。インデックスjは図1
0のステップS14において1だけインクリメントさ
れ、ステップS15においてインデックスjが32に到
達すると、上記内部ループを終了して図11のステップ
S20に進む。
Referring again to FIG. 9, a step S4 starts the inner loop of the flow. This loop iterates on the "partition index" j. The index j is shown in FIG.
When it is incremented by 1 in step S14 of 0 and the index j reaches 32 in step S15, the inner loop is terminated and the process proceeds to step S20 of FIG.

【0092】内部ループにおいて、ステップS5で、ピ
ーク値InterModMaxPeak[i][adjust_num[i]]が
最新の区分のピーク値MaxPeak[i][j]よりも小さ
いときは、ステップS6で、上記最新の区分のピーク値
MaxPeak[i][j]及びその位置する区分jに従っ
て、ピーク値InterModMaxPeak[i][adjust_num
[i]]及びピーク位置InterModMaxLoc[i][adjust
_num[i]]の値を更新してステップS7に進む。そう
でないときは、そのままステップS7に進む。
In the inner loop, when the peak value InterModMaxPeak [i] [adjust_num [i]] is smaller than the peak value MaxPeak [i] [j] of the latest segment in step S5, the latest value is updated in step S6. Peak value of category
Peak value InterModMaxPeak [i] [adjust_num according to MaxPeak [i] [j] and the segment j in which it is located.
[I]] and peak position InterModMaxLoc [i] [adjust
The value of _num [i]] is updated and the process proceeds to step S7. If not, the process proceeds directly to step S7.

【0093】ステップS7は、ステップS8及びステッ
プS9において減衰係数attn_ftrの値を決定するための
条件をチェックする。この条件は基本的に、先行する修
正ポイントがアタックポイントであるとき(alevcode
[i][adjust_num[i]−1]>0)、後のリリース
信号の基準(図11のステップS16)によって、信号
レベルが大きく減衰する(本実施形態では、4分の1よ
り小さくなる。)より急激なリリース信号が発見される
ということを予期して、ステップS9で減衰係数attn_f
trを4に設定するものである。先行する修正ポイントが
すでにリリースポイントであるとき、又は少なくともア
タックポイントではないとき(alevcode[i][adjust
_num[i]−1]≦0)、ステップS8で減衰係数attn
_ftrを3に設定することによって、後続のリリースの修
正ポイントは、より緩和された基準(本実施形態では、
3分の1より小さくなる。)によってそれの変数を決定
して具体化される必要がある。ステップS7の背景とな
る原理は、時間が経つにつれて次第にテーパ状に小さく
なるアタック信号を示す図6に説明されている。減衰係
数attn_ftrの異なる値は、変数を決定することによって
複数のリリースポイントを具体化することをより効果的
に促進し、従ってポストエコーの制御が必要と思われる
場合には、異なるレベルの増幅を適用することを可能に
する。
A step S7 checks the conditions for determining the value of the damping coefficient attn_ftr in the steps S8 and S9. This condition is basically when the preceding modification point is the attack point (alevcode
[I] [adjust_num [i] -1]> 0), and the signal level is largely attenuated (in the present embodiment, smaller than 1/4) by the reference of the later release signal (step S16 in FIG. 11). ) In anticipation of a more rapid release signal being discovered, the damping factor attn_f is determined in step S9.
It sets tr to 4. When the preceding modification point is already a release point, or at least not an attack point (alevcode [i] [adjust
_num [i] −1] ≦ 0), the attenuation coefficient attn in step S8
By setting _ftr to 3, the modification points for subsequent releases are more relaxed criteria (in this embodiment,
It is smaller than 1/3. ), It is necessary to determine its variables and be embodied. The principle behind step S7 is illustrated in FIG. 6, which shows an attack signal that taper off over time. Different values of the damping factor attn_ftr more effectively facilitate the realization of multiple release points by determining variables, and thus different levels of amplification when control of the post-echo seems necessary. Allows you to apply.

【0094】減衰係数attn_ftrが決定された後で、修正
関数計算部14bは、図10のステップS10のアタッ
ク信号の基準を満足することができるか否かをチェック
する。ここで、j+1番目の区分のピーク値MaxPeak
[i][j+1]が、j−7≦k≦jであるk番目の区
分のピーク値MaxPeak[i][k]の2倍以上であるか
否かが判断される。ただし、区分のインデックスkの下
限が0より小さいとき(すなわち、j≦7のとき)、区
分のピーク値MaxPeak[i][k]は、サブバンドiの
先行するサブバンドフレームの区分のピーク値MaxPeak
[i][k]ではなくて、サブバンドiのすでに利得制
御された先行するサブバンドフレームのピークの絶対値
として定義されるピーク値PrevFramePeak[i](ステ
ップS31を参照)に置換されるということを注意す
る。
After the attenuation coefficient attn_ftr is determined, the correction function calculation unit 14b checks whether or not the attack signal reference of step S10 of FIG. 10 can be satisfied. Here, the peak value MaxPeak of the j + 1st segment
It is determined whether or not [i] [j + 1] is at least twice the peak value MaxPeak [i] [k] of the k-th section where j-7 ≦ k ≦ j. However, when the lower limit of the segment index k is smaller than 0 (that is, when j ≦ 7), the segment peak value MaxPeak [i] [k] is the segment peak value of the preceding subband frame of the subband i. MaxPeak
Instead of [i] [k], the peak value PrevFramePeak [i] (see step S31) is defined as the absolute value of the peak of the already gain-controlled preceding subband frame of subband i. Be careful.

【0095】ステップS10の条件を満足できるなら
ば、現在の区分は潜在的な修正ポイントである。しかし
ながら、ビット数を節約するため、ステップS11はさ
らに条件を課して、新しい修正ポイントがその前にある
アタックポイントの区分(修正ポイントがアタックポイ
ントであるとき。)から十分な距離を隔てて存在するこ
とを必要とする。本実施形態は、1区分の分離を指示し
ている。この分離が存在しないときは、次の区分が修正
ポイントであるか否かを決定するために、ステップS1
4に進む。
If the condition of step S10 can be satisfied, the current division is a potential correction point. However, in order to save the number of bits, step S11 imposes an additional condition that the new modification point is present at a sufficient distance from the segment of the attack point in front of it (when the modification point is the attack point). Need to do. In this embodiment, separation of one section is instructed. If this separation does not exist, step S1 is performed to determine whether the next segment is a correction point.
Go to 4.

【0096】ステップS10及びS11の2つの基準が
満たされると、新しい修正ポイントであるj番目の区分
をアタックポイントとしてマーキングするために、ステ
ップS12で修正係数expoが1に設定される。ステップ
S13では、さまざまな変数を更新する。すなわち、修
正レベルalevcode[i][adjust_num[i]]を上記修
正係数expoに設定し、修正位置aloccode[i][adjust
_num[i]]を区分のインデックスjに設定し、修正ポ
イント数adjust_num[i]を1だけインクリメントす
る。さらに、上記インクリメントされた修正ポイント値
adjust_num[i]に対するピーク値InterModMaxPeak
[i][adjust_num[i]]を、区分のピーク値MaxPea
k[i][j+1]に設定し、かつ、上記ピーク値InterM
odMaxPeak[i][adjust_num[i]]のピーク位置Int
erModMaxLoc[i][adjust_num[i]]をj+1に設
定する。ただし、このステップS13で設定される修正
レベルalevcode[i][j]は単なるマーカーであり、
実際に信号に印加される増幅ではない点を注意してお
く。
If the two criteria of steps S10 and S11 are fulfilled, the correction factor expo is set to 1 in step S12 in order to mark the new correction point, the jth segment, as an attack point. In step S13, various variables are updated. That is, the correction level alevcode [i] [adjust_num [i]] is set to the correction coefficient expo, and the correction position aloccode [i] [adjust
_num [i]] is set to the segment index j, and the number of correction points adjust_num [i] is incremented by 1. Furthermore, the correction point value incremented above
Peak value InterModMaxPeak for adjust_num [i]
[I] [adjust_num [i]] is the peak value of the segment MaxPea
k [i] [j + 1] and the peak value InterM
Peak position Int of odMaxPeak [i] [adjust_num [i]]
Set erModMaxLoc [i] [adjust_num [i]] to j + 1. However, the modification level alevcode [i] [j] set in step S13 is a mere marker,
Note that this is not the amplification actually applied to the signal.

【0097】従って、ステップS10乃至ステップS1
3に係るアタック信号の開始位置を含む区分を識別する
処理では、修正関数計算部14bは、処理すべき現在の
区分に続く次の区分のピークの絶対値と、当該現在の区
分以前の予め決められた数(8個)の区分に係る各ピー
クの絶対値との比に基づいて、当該現在の区分がアタッ
ク信号の開始位置を含むか否かを決定し、当該現在の区
分が上記アタック信号の開始位置を含むと決定されたと
きは、アタック信号の開始位置を含むことを示す所定の
第1の値(すなわち、1)を当該現在の区分に割り当て
ることを特徴とする。
Therefore, steps S10 to S1
In the process of identifying a section including the start position of the attack signal according to No. 3, the correction function calculation unit 14b determines the absolute value of the peak of the next section following the current section to be processed and a predetermined value before the current section. It is determined whether or not the current segment includes the start position of the attack signal based on the ratio with the absolute value of each peak related to the determined number (8) segments, and the current segment is the attack signal. When it is determined to include the start position of the attack signal, a predetermined first value (ie, 1) indicating that the attack signal includes the start position is assigned to the current section.

【0098】ステップS10のアタック信号の基準を満
たすことができないとき、フローはステップS16のリ
リース信号の基準に進む。ここでは、j≦k≦j+7の
kに対して、上記減衰係数attn_ftrを乗算された区分の
ピーク値MaxPeak[i][k]が、先行する修正ポイント
と現在の区分との間のピーク値InterModMaxPeak[i]
[adjust_num[i]]よりも小さいか否かを判断する。
ただし、k>31であれば、使用される区分のピーク値
MaxPeak[i][k]は、ステップS45で定義された
未来のサブバンドフレームの区分から導出されることを
注意する。ステップS16の条件が満たされるならば、
ステップS17に進み、そうでないときは、次の区分が
修正ポイントであるか否かを決定するために、ステップ
S14に進む。
If the attack signal criteria of step S10 cannot be met, the flow proceeds to the release signal criteria of step S16. Here, the peak value MaxPeak [i] [k] of the section obtained by multiplying k of j ≦ k ≦ j + 7 by the damping coefficient attn_ftr is the peak value InterModMaxPeak between the preceding correction point and the current section. [I]
It is determined whether it is smaller than [adjust_num [i]].
However, if k> 31, the peak value of the segment used
Note that MaxPeak [i] [k] is derived from the partition of the future subband frame defined in step S45. If the condition of step S16 is satisfied,
If not, the process proceeds to step S14 to determine whether the next segment is a correction point.

【0099】ステップS17で、ピーク値InterModMaxP
eak[i][adjust_num[i]]の大きさに従って修正
係数expoの値を設定する。当該ピーク値InterModMaxPea
k[i][adjust_num[i]]が高いほど、リリースポ
イントに先行する大きな信号の部分がより大きく減衰さ
れるように、修正係数expoは負の数として小さくなる。
本実施形態では、16ビット(−32768乃至327
67)で表された信号強度に対して、ピーク値InterMod
MaxPeak[i][adjust_num[i]]の大きさが400
0未満のとき、修正係数expoは0に設定され、ピーク値
InterModMaxPeak[i][adjust_num[i]]の大きさ
が4000以上20000未満のとき、修正係数expoは
−1に設定され、ピーク値InterModMaxPeak[i][adj
ust_num[i]]の大きさが20000以上のとき、修
正係数expoは−2に設定される。ステップS18は、小
さな違いはあるがステップS13とほぼ同様に、さまざ
まな変数を更新する。すなわち、修正レベルalevcode
[i][adjust_num[i]]、修正位置aloccode[i]
[adjust_num[i]]、及び修正ポイント数adjust_num
[i]の設定は、ステップS13と同じである。ステッ
プS18では、さらに、ピーク値InterModMaxPeak
[i][adjust_num[i]]を、区分のピーク値MaxPea
k[i][j]に設定し、かつ、ピーク位置InterModMaxL
oc[i][adjust_num[i]]をjに設定する。ステッ
プS13の場合と同様に、修正レベルalevcodeに割り当
てられる値は、修正ポイントをリリースポイントとして
マーキングするのみである。修正レベルの実際の値は、
後に決定される。
At step S17, the peak value InterModMaxP
The value of the correction coefficient expo is set according to the size of eak [i] [adjust_num [i]]. The relevant peak value InterModMaxPea
The higher k [i] [adjust_num [i]], the smaller the correction factor expo becomes as a negative number, so that the part of the large signal preceding the release point is more attenuated.
In this embodiment, 16 bits (-32768 to 327) are used.
67) for the signal strength represented by
MaxPeak [i] [adjust_num [i]] size is 400
When it is less than 0, the correction coefficient expo is set to 0 and the peak value
When the magnitude of InterModMaxPeak [i] [adjust_num [i]] is 4000 or more and less than 20000, the modification coefficient expo is set to -1, and the peak value InterModMaxPeak [i] [adj
When the size of ust_num [i]] is 20000 or more, the modification coefficient expo is set to -2. In step S18, various variables are updated almost in the same manner as step S13 with a small difference. That is, the modification level alevcode
[I] [adjust_num [i]], correction position aloccode [i]
[Adjust_num [i]] and the number of correction points adjust_num
The setting of [i] is the same as in step S13. In step S18, the peak value InterModMaxPeak is further added.
[I] [adjust_num [i]] is the peak value of the segment MaxPea
Set to k [i] [j] and set peak position InterModMaxL
Set oc [i] [adjust_num [i]] to j. As in step S13, the value assigned to the modification level alevcode only marks the modification point as a release point. The actual value of the modification level is
It will be decided later.

【0100】従って、ステップS16乃至ステップS1
8に係るリリース信号の終了位置を含む区分を識別する
処理では、修正関数計算部14bは、処理すべき現在の
区分と、当該現在の区分に先行する修正ポイントとの間
における最大のピークの絶対値InterModMaxPeak[i]
[j]と、当該現在の区分以後の予め決められた数(8
個)の区分に係る各ピークの絶対値との比に基づいて、
当該現在の区分がリリース信号の終了位置を含むか否か
を決定し、当該現在の区分が上記リリース信号の終了位
置を含むと決定されたときは、リリース信号の終了位置
を含むことを示す所定の第2の値(0,−1,又は−
2)を当該現在の区分に割り当てることを特徴とする
Therefore, steps S16 to S1
In the process of identifying the section including the end position of the release signal according to No. 8, the correction function calculation unit 14b uses the absolute value of the maximum peak between the current section to be processed and the correction point preceding the current section. Value InterModMaxPeak [i]
[J] and a predetermined number after the current division (8
Based on the ratio with the absolute value of each peak related to
It is determined whether the current section includes the end position of the release signal, and when the current section is determined to include the end position of the release signal, a predetermined value indicating that the end section of the release signal is included. The second value of (0, -1, or-
2) is assigned to the current division

【0101】ステップS19は、それまでに発見された
修正ポイントがこれらに割り当てられた合計記憶量(す
なわち、20個)をすでに超過しているか否かをチェッ
クする。超過していなければ、次の区分が修正ポイント
であるか否かを決定するために、フローはステップS1
4に進む。そうでなければ、プロセスはインデックスj
による内部ループを終了してピーク値CurrFramePeak
[i]を決定する。ピーク値CurrFramePeak[i]は、
現在のサブバンドフレームに対する利得制御の目標の信
号レベルである「目標ピーク値」を表す。
A step S19 checks whether or not the correction points found so far have already exceeded the total storage amount (ie, 20) allocated to them. If not, the flow proceeds to step S1 to determine whether the next segment is a correction point.
Go to 4. Otherwise, the process is index j
End the inner loop due to the peak value CurrFramePeak
Determine [i]. The peak value CurrFramePeak [i] is
It represents a "target peak value" which is the target signal level of gain control for the current subband frame.

【0102】ステップS20は、先行するサブバンドフ
レームの修正ポイント数prev_adjust_num[i]が0で
あり、かつ現在のサブバンドフレームにおいて発見され
たすべての修正ポイントが「リリース信号」のタイプに
属するか否かをチェックする。条件が真であるときは、
修正関数計算部14bは、当該サブバンドフレームにお
けるオーディオサンプル信号が「自然な降下」をしてい
ると結論する。このような現象は発話音声の信号に共通
するものであり、ポストエコーを防止するためにこのよ
うな信号に利得制御を適用したならば、望ましくないア
ーティファクトが引き起こされる。ゆえに、これは、現
在のサブバンドフレームの修正ポイント数adjust_num
[i]をゼロにリセットし、減衰制限係数min_amp
[i]を4に設定して(ステップS21)、図13のス
テップS32に進む。減衰制限係数min_amp[i]の目
的は、過度の減衰を緩和することにあるが、これについ
ては後に詳述する。
A step S20 decides whether or not the number of correction points prev_adjust_num [i] of the preceding subband frame is 0 and all the correction points found in the current subband frame belong to the "release signal" type. I will check. When the condition is true,
The correction function calculation unit 14b concludes that the audio sample signal in the subband frame has "natural drop". Such a phenomenon is common to speech signals, and applying gain control to such signals to prevent post-echo causes unwanted artifacts. Therefore, this is the number of correction points in the current subband frame adjust_num
[I] is reset to zero and the damping limit coefficient min_amp
[I] is set to 4 (step S21), and the process proceeds to step S32 in FIG. The purpose of the damping limit coefficient min_amp [i] is to mitigate excessive damping, which will be described in detail later.

【0103】しかしながら、「自然な降下」現象が存在
しないときは、現在のサブバンドフレームは引き続き利
得制御を必要とする場合もあるので、図12のステップ
S22の目標ピーク値CurrFramePeak計算処理に進む。
ステップS22は、修正ポイントがマーキングされてい
るか否かをチェックし、適宜に、目標ピーク値CurrFram
ePeak[i]を設定する。
However, when the "natural drop" phenomenon does not exist, the current subband frame may still require gain control, so the process proceeds to the target peak value CurrFramePeak calculation process of step S22 in FIG.
A step S22 checks whether or not the correction points are marked, and appropriately sets the target peak value CurrFram.
Set ePeak [i].

【0104】図15に図示されたステップS22のサブ
ルーチンを参照すると、ステップS51で現在のサブバ
ンドフレームに修正ポイントが存在すると判断されたと
きは、ステップS52で始まる3つのステージで現在の
サブバンドフレームの目標ピーク値CurrFramePeak
[i]が計算される。ステップS52の式は、次のよう
に分析することができる。すなわち、アタックポイント
(alevcode[i][k]>0)が後に続くピーク値Inte
rModMaxPeak[i][k]については、目標ピーク値Cur
rFramePeak[i]は、修正ポイント間のピーク値InterM
odMaxPeak[i][k]そのものとなる。リリースポイ
ント(alevcode[i][k]≦0)が後に続くピーク値
InterModMaxPeak[i][k]については、目標ピーク
値CurrFramePeak[i]は、修正レベルalevcode[i]
[k]によって減衰された修正ポイント間のピーク値In
terModMaxPeak[i][k]となる。ステップS52の
最終的な目標ピーク値CurrFramePeak[i]は、0≦k
<adjust_num[i]のkに対するこれらすべての目標ピ
ーク値の最大値となる。ステップS52で取得された目
標ピーク値CurrFramePeak[i]は、ステップS53で
さらに(修正ポイントが後に存在しない)最後のピーク
値InterModMaxPeak[i][adjust_num[i]]と比較
され、ステップS54で未来のサブバンドフレームの最
初の区分のピーク値MaxPeak[i][32]と比較され
る。それらのうちの大きいほうが、最終的な目標ピーク
値CurrFramePeak[i]として選択される。ステップS
54は、次のサブバンドフレームの開始位置(すなわち
0番目の区分)に近接した(imminent)アタックに対す
るセーフガード(防護対策)として不可欠である。
Referring to the subroutine of step S22 shown in FIG. 15, when it is determined in step S51 that a correction point exists in the current subband frame, the current subband frame is detected in three stages starting in step S52. Target peak value of CurrFramePeak
[I] is calculated. The equation of step S52 can be analyzed as follows. That is, the peak value Inte followed by the attack point (alevcode [i] [k]> 0)
For rModMaxPeak [i] [k], the target peak value Cur
rFramePeak [i] is the peak value InterM between the correction points
It becomes odMaxPeak [i] [k] itself. Peak value followed by release point (alevcode [i] [k] ≤ 0)
For InterModMaxPeak [i] [k], the target peak value CurrFramePeak [i] is the modification level alevcode [i].
Peak value In between the correction points attenuated by [k]
terModMaxPeak [i] [k]. The final target peak value CurrFramePeak [i] in step S52 is 0 ≦ k
It is the maximum of all these target peak values for k of <adjust_num [i]. The target peak value CurrFramePeak [i] obtained in step S52 is further compared in step S53 with the last peak value InterModMaxPeak [i] [adjust_num [i]] (there is no correction point later), and in step S54 the future peak value The peak value MaxPeak [i] [32] of the first segment of the subband frame is compared. The larger of them is selected as the final target peak value CurrFramePeak [i]. Step S
54 is indispensable as a safeguard (protective measure) against an attack that is close to the start position (that is, the 0th section) of the next subband frame.

【0105】これに対して、修正ポイントが全く存在し
ないとステップS51で判断された場合は、ステップ
で、目標ピーク値CurrFramePeak[i]は単に、現在の
サブバンドフレームにおけるすべての区分のピーク値Ma
xPeak[i][k]と、未来のサブバンドフレームから
導出される最初の区分のピーク値MaxPeak[i][3
2]との最大値から導出される。従って、ステップS2
2に係る目標ピーク値CurrFramePeak計算処理では、修
正関数計算部14bは、互いに隣接する各1対の修正ポ
イント間の最大のピークの絶対値InterModMaxPeak
[i][j]と、割り当てられた第1の値(ステップS
13で割り当てられた修正レベルalevcode[i]
[j])及び第2の値(ステップS18で割り当てられ
た修正レベルalevcode[i][j])と、処理すべき現
在のフレームに続く次のフレームの最初の区分に係るピ
ークの絶対値MaxPeak[i][32]とに基づいて、当
該処理すべき現在のフレームのオーディオ信号を修正関
数に従って利得制御したときに所望される目標ピーク値
CurrFramePeak[i]を計算することを特徴とする。
On the other hand, if it is determined in step S51 that there are no correction points, then in step, the target peak value CurrFramePeak [i] is simply the peak value Ma of all sections in the current subband frame.
xPeak [i] [k] and the peak value MaxPeak [i] [3 of the first segment derived from the future subband frame
2] and the maximum value. Therefore, step S2
In the target peak value CurrFramePeak calculation process related to No. 2, the correction function calculation unit 14b causes the maximum peak absolute value InterModMaxPeak between each pair of correction points adjacent to each other.
[I] [j] and the assigned first value (step S
Modification level alevcode [i] assigned in 13
[J]) and the second value (correction level alevcode [i] [j] assigned in step S18) and the absolute value MaxPeak of the peak for the first segment of the next frame following the current frame to be processed. Based on [i] and [32], the desired peak value desired when the audio signal of the current frame to be processed is gain-controlled according to the correction function.
It is characterized by calculating CurrFramePeak [i].

【0106】目標ピーク値CurrFramePeak[i]が決定
されると、ステップS56でその大きさがチェックされ
る。これが200よりも小さいとき、処理は、全体的な
信号強度が小さすぎて、利得制御しても利点がないと結
論し、ビットはスペクトル量子化の際により十分に消費
されるようにとっておかれる。このため、ステップS5
7で、当該サブバンドフレームの修正ポイント数adjust
_num[i]をリセットして、図12のフローにリターン
し、ステップS23に進む。
When the target peak value CurrFramePeak [i] is determined, its magnitude is checked in step S56. When this is less than 200, the processing concludes that the overall signal strength is too small and gain control has no benefit, and the bits are set aside to be more fully consumed during spectral quantization. Therefore, step S5
7. Adjust the number of correction points for the subband frame
_num [i] is reset, the process returns to the flow of FIG. 12, and proceeds to step S23.

【0107】目標ピーク値CurrFramePeak[i]が有意
(ステップS56がNO)であれば、リターンして、ス
テップS23で修正レベルalevcode計算処理を実行す
る。図16に図示されたステップS23のサブルーチン
を参照すると、ステップS61で、各修正ポイントにつ
いて1つずつ実際の修正レベルalevcode[i][j]を
決定するために、jでインデックスを付与される新しい
内部ループを開始する。
If the target peak value CurrFramePeak [i] is significant (NO in step S56), the process returns and the correction level alevcode calculation process is executed in step S23. Referring to the subroutine of step S23 illustrated in FIG. 16, in step S61, a new indexed j is determined to determine the actual modification level alevcode [i] [j], one for each modification point. Start the inner loop.

【0108】当該ループにおいて、修正関数計算部14
bは、ステップS62で、現在の修正ポイントが、区分
0において具体化されているか否かをチェックする。具
体化されていれば、変数tempがステップS63において
区分のピーク値MaxPeak[i][0]と先行するサブバ
ンドフレームのピーク値PrevFramePeak[i]との大き
いほうに設定され、次いで、ステップS64において上
記変数tempに1の下限値が課される。ステップS62が
NOのときは、ステップS65において現在の修正ポイ
ントに先行するピーク値InterModMaxPeak[i][j]
がチェックされる。これが0より大きいときは、ステッ
プS66で、変数tempはピーク値InterModMaxPeak
[i][j]自体と等しくされる。これが0であるとき
は、ステップS68で「ゼロによって除算」されること
を防止するために、変数tempは1に設定される(ステッ
プS67)。ステップS64、S66、又はS67に続
いて、ステップS68で、2を底とする対数の整数部で
表された、目標ピーク値CurrFramePeak[i]と上記変
数tempとの比として、修正係数expo1が計算される。ス
テップS69は上記修正係数expo1の正負をチェック
し、それが0以上であるときは、ステップS70におい
て、修正係数expo1の整数部を改めて修正係数expoとし
て設定し、それが負であるときは、修正係数expo1から
0.5を減算した値の整数部を修正係数expoとして設定
する。異なる丸め/打切り方法はアーティファクトの可
聴性に大きく影響することが観察されているので、最後
のステップは重要である。
In the loop, the correction function calculation unit 14
In step S62, b checks whether or not the current correction point is embodied in category 0. If so, the variable temp is set to the larger of the segment peak value MaxPeak [i] [0] and the preceding subband frame peak value PrevFramePeak [i] in step S63, and then in step S64. A lower limit of 1 is imposed on the variable temp. If NO in step S62, the peak value InterModMaxPeak [i] [j] that precedes the current correction point in step S65.
Is checked. If this is greater than 0, the variable temp is set to the peak value InterModMaxPeak in step S66.
[I] [j] is made equal to itself. If it is 0, the variable temp is set to 1 to prevent being "divided by zero" in step S68 (step S67). Following step S64, S66, or S67, in step S68, the correction coefficient expo1 is calculated as the ratio between the target peak value CurrFramePeak [i] represented by the integer part of the base 2 logarithm and the variable temp. To be done. In step S69, whether the correction coefficient expo1 is positive or negative is checked. If it is 0 or more, the integer part of the correction coefficient expo1 is set again as the correction coefficient expo in step S70, and if it is negative, the correction coefficient expo1 is corrected. The integer part of the value obtained by subtracting 0.5 from the coefficient expo1 is set as the correction coefficient expo. The last step is important because different rounding / truncating methods have been observed to significantly affect the audibility of artifacts.

【0109】ステップS72は、増幅を軽減する必要が
あるか否かをチェックする。このステップは、ステップ
S20で扱われた「自然な降下」の現象と同様の意味で
発話音声の信号に共通して存在するアタック信号の「自
然な上昇」の現象に対処する上で不可欠である。「自然
な上昇」の現象は、図7に示されている。この条件の本
質は、現在のアタックポイントに続くピーク位置InterM
odMaxLoc[i][j+1]が、アタックポイント自体か
ら非常に「遠く離れた」位置にあれば、「自然な上昇」
に遭遇していると結論できるというものである。ステッ
プS72で「自然な上昇」が存在すると判断されたとき
は、ステップS73において、修正レベルalevcode
[i][j]はexpo−1に設定される。そうでないと
き、ステップS74において、修正レベルalevcode
[i][j]は修正指数expoに設定される。本実施形態
では、ステップS72の基準のために、5つの区分だけ
の分離距離を採用し、当該修正位置aloccode[i]
[j]がサブバンドフレームの最後の6つの区分よりも
前であることを条件として課している。
A step S72 checks whether or not it is necessary to reduce the amplification. This step is indispensable for coping with the phenomenon of "natural rise" of the attack signal which is commonly present in the signals of the spoken voice in the same sense as the phenomenon of "natural fall" treated in step S20. . The phenomenon of "natural rise" is shown in FIG. The essence of this condition is that the peak position InterM following the current attack point
“Natural climb” if odMaxLoc [i] [j + 1] is very “far” away from the attack point itself
You can conclude that you are encountering. If it is determined in step S72 that "natural increase" exists, the correction level alevcode is determined in step S73.
[I] [j] are set to expo-1. Otherwise, in step S74, the modification level alevcode
[I] [j] are set to the correction index expo. In this embodiment, the separation distances of only five sections are adopted for the reference of step S72, and the correction position aloccode [i]
The condition is that [j] is before the last 6 sections of the subband frame.

【0110】従って、修正関数計算部14bは、オーデ
ィオ信号に基づいて、発話音声に含まれる所定のゆるや
かな勾配で自然に降下する第1の信号部分を検出するス
テップS20と、オーディオ信号に基づいて、発話音声
に含まれる所定のゆるやかな勾配で自然に上昇する第2
の信号部分を検出するステップS72とを実行し、処理
すべき現在のフレームにおいて、識別されたアタック信
号の開始位置を含む区分と、識別されたリリース信号の
終了位置を含む区分とに基づいて、検出された第1の信
号部分の修正関数による利得制御を中止する一方、識別
されたアタック信号に基づいて計算される修正関数を減
少させて第2の信号部分の修正関数を計算することによ
り、当該現在のフレームにおける修正関数を計算するこ
とを特徴とする。ここで、修正関数計算部14bは、上
記第1の信号部分を検出するステップと、上記第2の信
号部分を検出するステップとのうちの一方のみを実行す
るように構成されていてもよい。また、第1の信号部分
を検出する処理は、現在のフレームに先行するフレーム
において修正ポイントである区分の数prev_adjust_num
[i]が所定の第1のしきい値より小さく(ステップS
41の条件に従って、prev_adjust_num[i]=0であ
る)、かつ現在のフレームにアタック信号が含まれてい
ないときに、第1の信号部分が存在すると決定し、第2
の信号部分を検出する処理は、アタック信号の開始位置
を含む区分と、当該区分から当該区分に続く次の修正ポ
イントまでの間における最大のピークの絶対値InterMod
MaxPeak[i][j]が存在する区分との間の分離区分
数が所定の第2のしきい値(すなわち、5)より大きい
ときに、第2の信号部分が存在すると決定することを特
徴とする。
Therefore, the correction function calculation unit 14b detects, based on the audio signal, the first signal portion which naturally falls at a predetermined gentle gradient included in the uttered voice, and based on the audio signal. , 2 that naturally rises with a predetermined gentle gradient included in the uttered voice
And step S72 of detecting the signal portion of, and based on the partition including the start position of the identified attack signal and the partition including the end position of the identified release signal in the current frame to be processed, By discontinuing the gain control by the detected correction function of the first signal portion while decreasing the correction function calculated based on the identified attack signal to calculate the correction function of the second signal portion, It is characterized in that a correction function in the current frame is calculated. Here, the correction function calculation unit 14b may be configured to execute only one of the step of detecting the first signal portion and the step of detecting the second signal portion. Further, the process of detecting the first signal portion is performed by the number of divisions that are correction points in the frame preceding the current frame prev_adjust_num
[I] is smaller than a predetermined first threshold value (step S
41, prev_adjust_num [i] = 0), and when the current frame does not include an attack signal, it is determined that the first signal portion exists, and
The process of detecting the signal part of is the maximum absolute value InterMod of the peak between the section including the start position of the attack signal and the next correction point following the section.
Determining that the second signal portion is present when the number of separated partitions with respect to the partition in which MaxPeak [i] [j] is present is greater than a predetermined second threshold (ie, 5). And

【0111】ステップS75は、ATRAC3標準によ
って要求される通り、計算された修正レベルalevcode
[i][j]を−3から11までに制限する。次に修正
関数計算部14bは、ステップS76で内部ループのイ
ンデックスjを1だけインクリメントし、次いで、ステ
ップS77においてすべての修正ポイントが処理された
か否かを判断する。次の修正ポイントに対する修正レベ
ルalevcode[i][j]を計算するときはステップS6
2に戻り、そうでないときはリターンしてステップS2
4に進む。
Step S75 is the calculated modification level alevcode as required by the ATRAC3 standard.
Limit [i] [j] to -3 to 11. Next, the correction function calculation unit 14b increments the index j of the inner loop by 1 in step S76, and then determines in step S77 whether all the correction points have been processed. When calculating the correction level alevcode [i] [j] for the next correction point, step S6
Return to step 2, otherwise return to step S2
Go to 4.

【0112】ステップS24では、同一の修正レベルal
evcodeを共有する連続的なポイントを統合することによ
り、余分な修正ポイントの数を調整する。特に連続する
2つの修正ポイントが同一の修正レベルalevcodeを共有
しているときは、第1の修正ポイントを除去することが
でき、第2の修正ポイントの修正レベルalevcodeの値
は、除去された第1の修正ポイントに先行する修正ポイ
ントと、当該第2の修正ポイントとの間の区分に対する
修正関数値を定義することができる。余分な修正ポイン
トを除去するとともに、修正ポイント数adjust_num
[i]、修正位置aloccode[i][j]、及び修正レベ
ルalevcode[i][j]を、それぞれ、再び各修正ポイ
ントに対して対応させることが必要である。次に、ステ
ップS25で、ATRAC3標準に適合させるために、
発見された修正ポイント数adjust_num[i]を、7以下
になるように制限する。従って、ステップS24の統合
の後でもなお存在する8番目以後の修正ポイントは、除
去される。
At step S24, the same modification level al
Adjust the number of extra correction points by integrating consecutive points sharing evcode. The first modification point can be removed, especially when two consecutive modification points share the same modification level alevcode, and the value of the modification level alevcode of the second modification point can be A correction function value can be defined for the section between the correction point preceding the one correction point and the second correction point. Remove unnecessary correction points and adjust the number of correction points adjust_num
[I], the correction position aloccode [i] [j], and the correction level alevcode [i] [j] need to be associated with each correction point again. Next, in step S25, in order to conform to the ATRAC3 standard,
The number of found correction points adjust_num [i] is limited to 7 or less. Therefore, the eighth and subsequent correction points that are still present after the integration in step S24 are removed.

【0113】次いで、ステップS26のサブバンドフレ
ーム間の差分制限処理を実行し、先行するサブバンドフ
レームの信号レベルを目標ピーク値CurrFramePeak
[i]と同様の大きさの信号レベルにまで変化させるた
めに、0番目の区分に修正ポイントを配置する必要があ
るか否かをチェックする。図4に図示されたように、一
連の修正が実行された後に、MDCTのために先行する
サブバンドフレームが現在のサブバンドフレームに縦続
接続される符号化のステップが存在するので、このサブ
バンドフレーム間の差分制限処理は不可欠である。
Then, the difference limiting process between the sub-band frames of step S26 is executed to set the signal level of the preceding sub-band frame to the target peak value CurrFramePeak.
It is checked whether or not a correction point needs to be arranged in the 0th section in order to change the signal level to the same level as [i]. As shown in FIG. 4, there is a coding step in which the preceding subband frame is cascaded to the current subband frame for MDCT after a series of modifications has been performed, so this subband Difference limiting processing between frames is indispensable.

【0114】図17のステップS26のサブルーチンを
参照すると、ステップS81では、先行するサブバンド
フレーム又は現在のサブバンドフレームの何れかが修正
ポイントを含み、かつ、ATRAC3標準に従って、さ
らに余分の修正ポイントを収容する余地がある(すなわ
ち、adjust_num[i]≦6)ならば、YESと応答す
る。これがYESであるときは、ステップS82及びS
83は、ステップS63及びS64と同様の方法で変数
tempの値を決定する。ステップS84は、変数tempの振
幅と目標ピーク値CurrFramePeak[i]の振幅をチェッ
クする。変数tempが目標ピーク値CurrFramePeak[i]
よりも大きくかつ目標ピーク値CurrFramePeak[i]が
比較的小さければ(この場合の基準は500未満である
か否か。)、目標ピーク値CurrFramePeak[i]と変数t
empの比の2倍の、2を底とする対数として、修正係数e
xpo1を計算する。そうでないときは、より小さい増幅係
数を生成するように、目標ピーク値CurrFramePeak
[i]と変数tempの比の、2を底とする対数として、修
正係数expo1を計算する。ステップS87乃至S89は
修正係数expo1の大きさをチェックし、ステップS88
及びステップS89において、適宜に修正係数expoが計
算される。言及したこのステップは、ステップS69乃
至S71に類似するものであり、同様の丸め/打切り論
理に従っている。ステップS90は、ATRAC3標準
が要求する通りに修正係数expoの下限(−3)及び上限
(11)を設定する。
Referring to the subroutine of step S26 of FIG. 17, in step S81, either the preceding sub-band frame or the current sub-band frame contains correction points, and according to the ATRAC3 standard, additional correction points are added. If there is room for accommodation (that is, adjust_num [i] ≦ 6), the response is YES. If this is YES, steps S82 and S
83 is a variable in the same manner as in steps S63 and S64.
Determine the value of temp. A step S84 checks the amplitude of the variable temp and the amplitude of the target peak value CurrFramePeak [i]. The variable temp is the target peak value CurrFramePeak [i]
Is larger than the target peak value CurrFramePeak [i] and the target peak value CurrFramePeak [i] is relatively small (whether the reference in this case is less than 500), the target peak value CurrFramePeak [i] and the variable t
The correction coefficient e is the logarithm whose base is 2, which is twice the ratio of emp.
Calculate xpo1. Otherwise, the target peak value CurrFramePeak is generated so that a smaller amplification factor is generated.
The correction coefficient expo1 is calculated as the base 2 logarithm of the ratio of [i] to the variable temp. Steps S87 to S89 check the magnitude of the correction coefficient expo1, and step S88
Then, in step S89, the correction coefficient expo is calculated appropriately. This step referred to is similar to steps S69 to S71 and follows similar rounding / truncating logic. A step S90 sets the lower limit (-3) and the upper limit (11) of the modification coefficient expo as required by the ATRAC3 standard.

【0115】従って、ステップS26において、修正関
数計算部14bは、互いに隣接した2つのフレームであ
る第1及び第2のフレームにおいて、利得制御後のオー
ディオ信号のうちの第1のフレームのピークの絶対値Pr
evFramePeak[i]と第2のフレームのピークの絶対値C
urrFramePeak[i]とが異なるとき、上記各ピークの絶
対値が等しくなるように、上記第2のフレームの最初の
区分に係る修正関数値を補正することを特徴とする。
Therefore, in step S26, the correction function calculation unit 14b determines the absolute value of the peak of the first frame of the gain-controlled audio signal in the first and second frames, which are two adjacent frames. Value Pr
evFramePeak [i] and the absolute value C of the peak of the second frame
When urrFramePeak [i] is different, the correction function value relating to the first section of the second frame is corrected so that the absolute values of the respective peaks become equal.

【0116】ステップS91は、この追加の修正ポイン
トを挿入できるようになる前に満足される必要がある第
2の条件を表している。現在のサブバンドフレームが修
正ポイントを持たないか、もしくは、もともとサブバン
ドフレームの先頭部分に同じ修正係数expoを生じる修正
ポイントが存在していないときに、この条件はYESで
ある。実際にそうであれば、ステップS92で新しい修
正ポイントが挿入され、すべての既存の修正ポイントを
後にシフトさせて、adjust_num[i]を1だけインクリ
メントし、フローはステップS27に進む。
Step S91 represents a second condition that must be met before this additional correction point can be inserted. This condition is YES when the current subband frame has no correction point or when there is originally no correction point that produces the same correction coefficient expo at the beginning of the subband frame. If so, a new correction point is inserted in step S92, all existing correction points are later shifted, increment adjust_num [i] by 1, and the flow proceeds to step S27.

【0117】ステップS91がNOの応答をするとき、
これは、現在の及び過去のサブバンドフレームの信号強
度の差分(もしあれば)に関わらず、遷移は本質的に緩
やかであることを含意している。ゆえに、従属接続され
るサブバンドフレーム間を結合する修正ポイントは不要
であり、フローはステップS27に進む。
When step S91 gives a NO response,
This implies that the transitions are inherently gradual regardless of the difference (if any) in the signal strength of the current and past subband frames. Therefore, a correction point for connecting sub-frames connected in cascade is not necessary, and the flow proceeds to step S27.

【0118】第1の修正ポイントが減衰ポイント(すな
わち、リリースポイント)であると判明したときは、ス
テップS27は、下限−min_amp[i]−1を課すこと
によって、アーティファクトを発生させがちな、先行す
るサブバンドフレームに対する潜在的に過度な減衰を緩
和する。減衰制限係数min_amp[i]は、先行するサブ
バンドフレームのアタックポイントに対して適用され
る、最小の修正レベルalevcode[i][k]として定義
されている。従って、ステップS27において、修正関
数計算部14bは、上記利得制御部15−1乃至15−
4の処理の後段において、上記互いに隣接した2つのフ
レームである第1及び第2のフレームのオーディオ信号
が互いに実質的に連続するように、第1のフレームのオ
ーディオ信号に対して第2のフレームの最初の区分に係
る修正関数値を乗算して補正し、修正関数計算部14b
は、上記第1のフレームの各区分に係る修正関数値のう
ちの、オーディオ信号を増幅する最小の修正関数値min_
amp[i]に基づいて、上記オーディオ信号を増幅する
修正関数により利得制御されるべき第1のフレームのオ
ーディオ信号を、上記乗算して補正することにより減衰
させることを防止するように、上記第2のフレームの最
初の区分に係る修正関数値を補正することを特徴とす
る。
If the first correction point is found to be the decay point (ie, the release point), step S27 imposes a lower bound of -min_amp [i] -1, which tends to cause artifacts, leading Mitigates potentially excessive attenuation for subband frames that do. The attenuation limit coefficient min_amp [i] is defined as the minimum modification level alevcode [i] [k] applied to the attack point of the preceding subband frame. Therefore, in step S27, the correction function calculation unit 14b causes the gain control units 15-1 to 15-.
In the latter stage of the processing of 4, the second frame is added to the audio signal of the first frame so that the audio signals of the first and second frames, which are the two adjacent frames, are substantially continuous with each other. Correction function value relating to the first section of the
Is the minimum correction function value min_ for amplifying the audio signal among the correction function values related to each section of the first frame.
On the basis of amp [i], the audio signal of the first frame to be gain-controlled by a correction function for amplifying the audio signal is prevented from being attenuated by being multiplied and corrected. It is characterized in that the correction function value relating to the first division of the second frame is corrected.

【0119】次に、ステップS28においてサブバンド
フレームの終端部利得制御処理を実行して、ポストエコ
ー制御の開始位置をマーキングする。図18を参照する
と、ステップS101において、余分の修正ポイントの
受入れがいまだ可能か否か(修正ポイント数adjust_num
[i]がATRAC3標準によって決められた上限より
も小さいか。)、及び現在の最後の修正ポイントがすで
にサブバンドフレームの終わりにかなり近づいているか
否か(サブバンドフレームの最後の3つの区分よりも前
か。)をチェックする。条件が許せば、プロセスはステ
ップS102に進み、ここで、サブバンドフレームの最
後の修正位置の後におけるすべての区分のピーク値MaxP
eak[i][k]に基づいて上記ピーク値の最大値MaxVa
lueが生成され、次いで、ステップS103で修正係数e
xpoが計算され(2を底とする対数の整数部で表され
た、目標ピーク値CurrFramePeak[i]と上記最大値Max
Valueとの比)、最後にステップS104に進み、ここ
で、修正係数expoによる新しい修正が31番目の区分に
挿入される。このステップは、図8に示されている。
Next, in step S28, the termination gain control processing of the subband frame is executed to mark the start position of the post echo control. Referring to FIG. 18, in step S101, it is still possible to accept the extra correction points (the number of correction points adjust_num).
Is [i] less than the upper limit set by the ATRAC3 standard? ), And whether the current last modification point is already quite close to the end of the subband frame (before the last three partitions of the subband frame). If the conditions allow, the process proceeds to step S102, where the peak value MaxP of all partitions after the last modified position of the subband frame.
The maximum value MaxVa of the above peak values based on eak [i] [k]
lue is generated, and then in step S103, the correction coefficient e
xpo is calculated (the target peak value CurrFramePeak [i] expressed by the integer part of the base 2 logarithm) and the maximum value Max
(Ratio with Value), and finally, the process proceeds to step S104, where a new correction by the correction coefficient expo is inserted in the 31st section. This step is shown in FIG.

【0120】従って、修正関数計算部14bは、ステッ
プS28で、処理すべき現在のフレームにおける最後の
修正ポイントの区分aloccode[i][adjust_num[i]
−1]より後方に位置する現在のフレームの各区分にお
ける最大のピークの絶対値MaxValueが上記目標ピーク値
CurrFramePeak[i]と異なるときに、上記最大のピー
クの絶対値MaxValueが上記目標ピーク値CurrFramePeak
[i]に等しくなるように、上記後方に位置する現在の
フレームの各区分に係る修正関数値を補正することを特
徴とする。
Therefore, in step S28, the correction function calculation unit 14b determines the last correction point segment aloccode [i] [adjust_num [i] in the current frame to be processed.
-1], the absolute value MaxValue of the maximum peak in each section of the current frame located behind is the target peak value.
When different from CurrFramePeak [i], the absolute value MaxValue of the maximum peak is the target peak value CurrFramePeak
It is characterized in that the correction function value relating to each section of the current frame located at the rear side is corrected so as to be equal to [i].

【0121】ステップS101の条件が許可しない場
合、もしくはステップS104で新しい修正ポイントが
その変数を決定することによって具体化された後は、プ
ロセスはステップS29に進み、ここで、減衰制限係数
min_amp[i]の値が導出される。繰り返すと、減衰制
限係数min_amp[i]は、ステップS27で過度の減衰
を緩和するために必要なものである。
If the condition of step S101 does not allow, or after a new correction point has been implemented in step S104 by determining its variable, the process proceeds to step S29 where the damping limit factor is
The value of min_amp [i] is derived. Repeatedly, the damping limit coefficient min_amp [i] is necessary for alleviating excessive damping in step S27.

【0122】ステップS30は、ATRAC3標準によ
って要求される表現と適合させるために、すべての修正
レベルalevcode[i][j]に4を加算する。ステップ
S31は、計算された修正位置及び修正レベルに基づい
て、当該サブバンドフレームの修正関数を計算する。ス
テップS31ではまた、次のサブバンドフレームの修正
関数の計算で使用するために、修正関数によって利得制
御された当該サブバンドフレームのピーク値(すなわ
ち、次のサブバンドフレームに対して「先行する」サブ
バンドフレームの利得制御されたピーク値)PrevFrameP
eak[i]の値を計算する。その後はステップS32で
インデックスiを1だけインクリメントして、ステップ
S33がYESならば、別のサブバンド(i+1)のサ
ブバンドフレームを処理する。
Step S30 adds 4 to all modification levels alevcode [i] [j] to match the representation required by the ATRAC3 standard. A step S31 calculates a correction function of the subband frame based on the calculated correction position and correction level. Also in step S31, the peak value of the subband frame (that is, "leads" to the next subband frame) gain-controlled by the correction function for use in the calculation of the correction function of the next subband frame. Gain-controlled peak value of subband frame) PrevFrameP
Calculate the value of eak [i]. After that, the index i is incremented by 1 in step S32, and if YES in step S33, the subband frame of another subband (i + 1) is processed.

【0123】当該オーディオフレームのすべてのサブバ
ンドが処理されると、ステップS34で入力信号のすべ
てのオーディオフレーム(また、それらのサブバンドフ
レーム)が処理されたか否かをチェックする。処理すべ
きサブバンドフレームがまだ残っているときは、ステッ
プS1に戻って、バッファメモリ14から次のサブバン
ドフレームのサンプル信号を読み出し、一方、すべての
サブバンドフレームが処理されたときは、修正関数計算
処理を終了する。
When all the sub-bands of the audio frame have been processed, it is checked in step S34 whether all the audio frames (and their sub-bands) of the input signal have been processed. When there are still sub-band frames to be processed, the process returns to step S1 to read the sample signal of the next sub-band frame from the buffer memory 14, while when all the sub-band frames have been processed, correction is made. The function calculation process ends.

【0124】計算された修正関数は、利得制御部15−
1乃至15−4に送られて、オーディオサンプル信号に
乗算されるとともに、サイド情報としてビットストリー
ムマルチプレクサに送られる。
The calculated correction function is the gain control unit 15-
1 to 15-4, the audio sample signal is multiplied, and side information is sent to the bit stream multiplexer.

【0125】以上説明したように、本発明に係る実施形
態のオーディオ信号の符号化方法及び装置、並びに符号
化及び複合化システムによれば、修正関数をより正確に
生成して利得制御を実行することにより、プリエコー雑
音及びポストエコー雑音を確実に抑圧することができ
る。また、本実施形態に係るオーディオ信号の符号化方
法及び装置によれば、発話音声に対する基準を特別に組
込むことにより、利得制御によるアーティファクトを除
去することができる。
As described above, according to the audio signal coding method and apparatus and the coding and decoding system of the embodiment of the present invention, the correction function is more accurately generated and the gain control is executed. As a result, the pre-echo noise and the post-echo noise can be surely suppressed. Further, according to the audio signal encoding method and apparatus according to the present embodiment, it is possible to remove the gain control artifacts by specially incorporating the reference for the speech voice.

【0126】本発明は、上述の8つの改善拡張事項に対
応して以下の特有の効果を有する。まず、現在のサブバ
ンドフレームの後に続く未来のサブバンドフレームをよ
り自由に用いることは、リリース信号のより良好な検出
をもたらすと同時に、「境界アタック」の制御も引き続
き達成している(改善拡張事項(2)参照)。また、そ
の可変なリリース信号の基準とポストエコーに対する直
接の制御とは、長時間にわたって続くリリース信号の分
割及び制御をより効果的に援助している(改善拡張事項
(3)及び(8)参照)。さらに、目標ピーク値CurrFr
amePeakを用いることは、サブバンドフレーム全体の尺
度で望ましい信号レベルに調整することを援助し、間接
的には、先願の発明によって利得制御されたサブバンド
フレームよりも、利得制御されたサブバンドフレームを
より滑らかに変化させる結果となる(改善拡張事項
(4)参照)。これは、連続する2つのサブバンドフレ
ームの信号レベルを、互いに大きな差が出ないように同
様のレベルに設定する試みによってさらに強化される
(改善拡張事項(1)、(6)及び(7)参照)。最後
に、自然な上昇と自然な降下を検出することで、過剰な
制御によってこうむるアーティファクトに脆弱な発話音
声の信号が特別に配慮される(改善拡張事項(5)参
照)。
The present invention has the following unique effects in response to the above eight improvements and extensions. Firstly, the more free use of future subband frames following the current subband frame results in better detection of the release signal, while at the same time achieving "boundary attack" control (improved extension See item (2)). Further, the variable release signal reference and the direct control for the post echo more effectively assist the division and control of the release signal that continues for a long time (refer to improvement extension items (3) and (8)). ). Furthermore, the target peak value CurrFr
The use of amePeak helps to adjust to the desired signal level on a scale of the entire subband frame, and indirectly, the gain-controlled subband rather than the gain-controlled subband frame according to the invention of the earlier application. As a result, the frame is changed more smoothly (see improvement and extension item (4)). This is further strengthened by an attempt to set the signal levels of two consecutive subband frames to similar levels so as not to make a large difference from each other (improvement extensions (1), (6) and (7)). reference). Finally, by detecting natural rises and falls, special attention is given to speech signals that are vulnerable to artifacts caused by excessive control (see improvement extension (5)).

【0127】余分なコード及び計算にも関わらず、本ア
ルゴリズムは、その低い計算及び記憶要件のために、L
SI実装が実現可能なものである。
Despite the extra code and computation, the present algorithm, due to its low computation and storage requirements,
SI implementation is feasible.

【0128】以上の実施形態においては、MDCT処理
を行っているが、本発明はこれに限らず、種々の直交変
換処理を行ってもよい。
Although MDCT processing is performed in the above embodiments, the present invention is not limited to this, and various orthogonal transformation processing may be performed.

【0129】以上の実施形態においては、修正関数を計
算するときに2つのサブバンドフレームに基づいて計算
しているが、本発明はこれに限らず、少なくとも2つの
サブバンドフレーム、又はサブバンドに分割されていな
い少なくとも2つのフレームに基づいて計算してもよ
い。
In the above embodiment, the correction function is calculated based on two subband frames, but the present invention is not limited to this, and at least two subband frames or subbands are calculated. It may be calculated based on at least two frames that are not divided.

【0130】[0130]

【発明の効果】以上詳述したように、本発明に係るオー
ディオ信号の符号化方法又は装置によれば、入力された
オーディオ信号に基づいてフレーム毎に修正関数を計算
して、計算された修正関数に従って上記オーディオ信号
に対して利得制御するステップと、上記利得制御された
オーディオ信号に対して、縦続接続された互いに隣接す
る2つのフレーム毎に直交変換処理を行いかつ符号化処
理を行うことにより符号化されたビットストリーム信号
を得るステップとを実行し、上記利得制御するステップ
は、入力されたオーディオ信号をフレームの時間よりも
短い時間の複数の区分に分割し、上記分割された各区分
のピークの絶対値を計算するステップと、上記分割され
た区分を有するオーディオ信号に基づいて、急激な音の
立上がりを含む信号の部分であるアタック信号の開始位
置を含む区分を修正ポイントとして識別するステップ
と、上記分割された区分を有するオーディオ信号に基づ
いて、急激な音の立下がりを含む信号の部分であるリリ
ース信号の終了位置を含む区分を修正ポイントとして識
別するステップと、上記分割された区分を有するオーデ
ィオ信号に基づいて、上記修正関数に従って利得制御し
たときに所望される、処理すべき現在のフレームにおけ
る目標ピーク値を計算するステップと、上記識別された
アタック信号の開始位置を含む区分と、上記識別された
リリース信号の終了位置を含む区分と、上記計算された
目標ピーク値とに基づいて、当該現在のフレームの各区
分に係る修正関数値からなる修正関数を計算するステッ
プとを含む。
As described above in detail, according to the audio signal encoding method or apparatus of the present invention, the correction function is calculated for each frame based on the input audio signal, and the calculated correction is performed. A step of performing gain control on the audio signal according to a function, and an orthogonal transform process and an encoding process on the gain-controlled audio signal for every two adjacent frames connected in cascade. Obtaining an encoded bitstream signal, and performing the gain control, dividing the input audio signal into a plurality of sections of a time shorter than the time of a frame, and dividing each of the divided sections. Calculating the absolute value of the peak, and based on the audio signal having the above-mentioned divided sections, a signal including a sudden rise of sound is generated. Identifying a section including the start position of the attack signal, which is a part of the signal, as a correction point, and based on the audio signal having the divided section, a release signal which is a part of the signal including a sharp fall of the sound. Identifying the segment containing the end position as a correction point, and the desired peak value in the current frame to be processed desired when gain controlled according to the correction function based on the audio signal having the divided segment. The step of calculating, the section including the start position of the identified attack signal, the section including the end position of the identified release signal, and the calculated target peak value based on the current frame. Calculating a correction function consisting of the correction function values for each section of.

【0131】従って、本発明では、先願の発明のように
区分毎に修正ポイントの有無を決定してその修正レベル
を計算するのではなく、まず修正ポイントの有無を決定
し、次いでフレームの目標ピーク値を計算し、その後に
修正レベルを計算することによって、フレーム全体を考
慮した利得制御が可能になる。これにより、修正関数を
より正確に生成して利得制御を実行して、プリエコー雑
音及びポストエコー雑音を確実に抑圧することができ
る。
Therefore, in the present invention, the presence or absence of a correction point is not determined for each section to calculate the correction level as in the invention of the prior application, but the presence or absence of the correction point is first determined, and then the frame target is determined. By calculating the peak value and then the correction level, gain control considering the whole frame is possible. As a result, the correction function can be generated more accurately, the gain control can be executed, and the pre-echo noise and the post-echo noise can be surely suppressed.

【0132】また、本発明に係るオーディオ信号の符号
化方法又は装置によれば、入力されたオーディオ信号に
基づいてフレーム毎に修正関数を計算して、計算された
修正関数に従って上記オーディオ信号に対して利得制御
するステップと、上記利得制御されたオーディオ信号に
対して、縦続接続された互いに隣接する2つのフレーム
毎に直交変換処理を行いかつ符号化処理を行うことによ
り符号化されたビットストリーム信号を得るステップと
を実行し、上記利得制御するステップは、入力されたオ
ーディオ信号をフレームの時間よりも短い時間の複数の
区分に分割するステップと、上記分割された区分を有す
るオーディオ信号に基づいて、急激な音の立上がりを含
む信号の部分であるアタック信号の開始位置を含む区分
を修正ポイントとして識別するステップと、上記分割さ
れた区分を有するオーディオ信号に基づいて、急激な音
の立下がりを含む信号の部分であるリリース信号の終了
位置を含む区分を修正ポイントとして識別するステップ
と、上記分割された区分を有するオーディオ信号に基づ
いて、発話音声に含まれる所定のゆるやかな勾配で自然
に降下する第1の信号部分を検出するステップと、上記
分割された区分を有するオーディオ信号に基づいて、発
話音声に含まれる所定のゆるやかな勾配で自然に上昇す
る第2の信号部分を検出するステップとの少なくとも一
方を含み、上記利得制御するステップは、処理すべき現
在のフレームにおいて、上記識別されたアタック信号の
開始位置を含む区分と、上記識別されたリリース信号の
終了位置を含む区分とに基づいて、上記検出された第1
の信号部分の修正関数による利得制御を中止する一方、
上記識別されたアタック信号に基づいて計算される修正
関数を減少させて上記第2の信号部分の修正関数を計算
することにより、当該現在のフレームにおける修正関数
を計算するステップとを含む。
Further, according to the audio signal coding method or apparatus of the present invention, a correction function is calculated for each frame based on the input audio signal, and the audio signal is processed according to the calculated correction function. And a gain control step, and a bit stream signal encoded by performing an orthogonal transform process and an encoding process on every two adjacent frames that are cascade-connected to the gain-controlled audio signal. And the gain control step is based on dividing the input audio signal into a plurality of sections of a time shorter than the time of a frame, and based on the audio signal having the divided sections. , The section including the start position of the attack signal, which is the part of the signal including the sharp rise of the sound, and the correction point Identifying the segment containing the end position of the release signal, which is the portion of the signal containing the abrupt fall of the sound, as the correction point based on the audio signal having the divided segment. Detecting, based on the audio signal having the divided sections, a first signal portion included in the uttered voice that naturally falls at a predetermined gentle gradient; and based on the audio signal having the divided sections, And / or detecting a second signal portion that naturally rises with a predetermined gentle slope contained in the spoken voice, the gain controlling step including the step of identifying the gain in the current frame to be processed. Based on the section including the start position of the attack signal and the section including the end position of the identified release signal, The first, which is the serial detection
While stopping the gain control by the correction function of the signal part of
Calculating a correction function for the current frame by reducing a correction function calculated based on the identified attack signal to calculate a correction function for the second signal portion.

【0133】従って、本発明によれば、発話音声に特有
な信号レベルに係る自然な上昇及び自然な降下を検出
し、オーディオ信号に過度の増幅及び過度の減衰が適用
されることを防止するので、発話音声であるオーディオ
信号に対してアーティファクトの発生を抑制することが
できる。これにより、修正関数をより正確に生成して利
得制御を実行して、プリエコー雑音及びポストエコー雑
音を確実に抑圧することができる。
Therefore, according to the present invention, it is possible to detect the natural rise and the natural fall of the signal level peculiar to the spoken voice and prevent the excessive amplification and the excessive attenuation from being applied to the audio signal. , It is possible to suppress the occurrence of artifacts in the audio signal which is the uttered voice. As a result, the correction function can be generated more accurately, the gain control can be executed, and the pre-echo noise and the post-echo noise can be surely suppressed.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明の一実施形態に係るミニディスク記録
再生システムの構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a mini disk recording / reproducing system according to an embodiment of the present invention.

【図2】 図1のオーディオエンコーダ2の詳細構成を
示すブロック図である。
FIG. 2 is a block diagram showing a detailed configuration of the audio encoder 2 of FIG.

【図3】 図1のオーディオデコーダ6の詳細構成を示
すブロック図である。
3 is a block diagram showing a detailed configuration of the audio decoder 6 of FIG.

【図4】 図2のMDCT処理部16−1に先行する利
得検出部14及び利得制御部15−1における変換ブロ
ックの生成を示すブロック図である。
4 is a block diagram showing generation of a conversion block in a gain detection unit 14 and a gain control unit 15-1 preceding the MDCT processing unit 16-1 in FIG.

【図5】 入力されたオーディオサンプル信号と、図2
の修正関数計算部14bが上記オーディオサンプル信号
を処理して配置された修正ポイントと、結果的に得られ
た修正関数とを図示するグラフである。
FIG. 5 shows an input audio sample signal and FIG.
14 is a graph showing the correction points arranged by the correction function calculation unit 14b processing the audio sample signal and the resulting correction function.

【図6】 図5の入力されたオーディオサンプル信号に
対するアタック信号の基準とリリース信号の基準を表す
概略図である。
FIG. 6 is a schematic diagram showing a reference of an attack signal and a reference of a release signal with respect to the input audio sample signal of FIG.

【図7】 (a)は自然な上昇を示すアタック信号を含
むオーディオサンプル信号を示す図であり、(b)は
(a)の信号を増幅することによって発生したアーティ
ファクトを含む信号を示す図であり、(c)は(b)の
増幅を緩和することによってアーティファクトが低減さ
れた信号を示す図である。
7A is a diagram showing an audio sample signal including an attack signal showing a natural rise, and FIG. 7B is a diagram showing a signal including an artifact generated by amplifying the signal in FIG. Yes, (c) is a diagram showing a signal with reduced artifacts by mitigating the amplification of (b).

【図8】 (a)はアタック信号及びリリース信号を含
むサブバンドフレームの終端を示す図であり、(b)は
(a)のアタック信号及びリリース信号に対して利得制
御した後のサブバンドフレームを示す図であり、(c)
はポストエコーに対抗するために(b)の弱い終端を増
幅したサブバンドフレームを示す図である。
8A is a diagram showing an end of a subband frame including an attack signal and a release signal, and FIG. 8B is a subband frame after gain control is performed on the attack signal and the release signal in FIG. 8A. It is a figure which shows, (c)
FIG. 3B is a diagram showing a subband frame in which the weak end in (b) is amplified to counter post-echo.

【図9】 図2の修正関数計算部14によって実行され
る修正関数計算処理の第1の部分を示すフローチャート
である。
9 is a flowchart showing a first part of a correction function calculation process executed by the correction function calculation unit 14 in FIG.

【図10】 図2の修正関数計算部14によって実行さ
れる修正関数計算処理の第2の部分を示すフローチャー
トである。
10 is a flowchart showing a second part of the correction function calculation process executed by the correction function calculation unit 14 in FIG.

【図11】 図2の修正関数計算部14によって実行さ
れる修正関数計算処理の第3の部分を示すフローチャー
トである。
11 is a flowchart showing a third part of the correction function calculation processing executed by the correction function calculation unit 14 of FIG.

【図12】 図2の修正関数計算部14によって実行さ
れる修正関数計算処理の第4の部分を示すフローチャー
トである。
12 is a flowchart showing a fourth part of the correction function calculation process executed by the correction function calculation unit 14 of FIG.

【図13】 図2の修正関数計算部14によって実行さ
れる修正関数計算処理の第5の部分を示すフローチャー
トである。
13 is a flowchart showing a fifth part of the correction function calculation process executed by the correction function calculation unit 14 in FIG.

【図14】 図9のステップS3の初期化処理のサブル
ーチンを示すフローチャートである。
FIG. 14 is a flowchart showing a subroutine of initialization processing in step S3 of FIG.

【図15】 図12のステップS22の目標ピーク値Cu
rrFramePeak計算処理のサブルーチンを示すフローチャ
ートである。
FIG. 15 is a target peak value Cu in step S22 of FIG.
It is a flow chart which shows a subroutine of rrFramePeak calculation processing.

【図16】 図12のステップS23の修正レベルalev
code計算処理のサブルーチンを示すフローチャートであ
る。
FIG. 16 is a modification level alev of step S23 of FIG.
It is a flow chart which shows a subroutine of code calculation processing.

【図17】 図12のステップS26のサブバンドフレ
ーム間のレベルの差分制限処理のサブルーチンを示すフ
ローチャートである。
17 is a flowchart showing a subroutine of a level difference limiting process between subband frames in step S26 of FIG.

【図18】 図12のステップS28のサブバンドフレ
ームの終端部利得制御処理のサブルーチンを示すフロー
チャートである。
FIG. 18 is a flowchart showing a subroutine of a termination part gain control process of the subband frame in step S28 of FIG.

【図19】 (a)は、利得制御をせず、プリエコーや
ポストエコーが発生するときの従来技術のオーディオ信
号の符号化及び復号化装置の構成を示すブロック図であ
り、(b)は、利得制御を行い、プリエコーやポストエ
コーを抑圧するときの従来技術のオーディオ信号の符号
化及び復号化装置の構成を示すブロック図である。
19 (a) is a block diagram showing the configuration of a conventional audio signal encoding / decoding apparatus when pre-echo and post-echo are generated without gain control. FIG. FIG. 11 is a block diagram showing a configuration of a conventional audio signal encoding / decoding apparatus when performing gain control and suppressing pre-echo and post-echo.

【符号の説明】[Explanation of symbols]

1…A/Dコンバータ、 2…オーディオエンコーダ、 3…ミニディスク記録装置、 4…ミニディスク、 5…ミニディスク再生装置、 6…オーディオデコーダ、 7…D/Aコンバータ、 10…QMF分割フィルタ、 11…ローパスフィルタ、 12…ハイパスフィルタ、 13−1乃至13−4…フィルタバンク、 14…利得検出部、 14a…バッファメモリ、 14b,14b−a,14b−b,14b−c…修正関
数計算部、 15−1乃至15−4…利得制御部、 16−1乃至16−4…MDCT処理部、 17−1乃至17−4…トーン成分符号化器、 18−1乃至18−4…トーン成分量子化器、 19−1乃至19−4…スペクトル量子化器、 20…ビットストリームマルチプレクサ、 21…ビットストリームデマルチプレクサ、 22−1乃至22−4…トーン成分逆量子化器、 23−1乃至23−4…スペクトル逆量子化器、 24−1乃至24−4…トーン成分復号化器、 25−1乃至25−4…逆MDCT処理部、 26−1乃至26−4…逆利得制御部、 27…QMF合成フィルタ、 CO1,CO2…縦続接続演算子、 MP1a,MP1b,MP1c,MP2a,MP2b,
MP2c…乗算器。
DESCRIPTION OF SYMBOLS 1 ... A / D converter, 2 ... Audio encoder, 3 ... Mini disc recording device, 4 ... Mini disc, 5 ... Mini disc reproducing device, 6 ... Audio decoder, 7 ... D / A converter, 10 ... QMF division filter, 11 ... low-pass filter, 12 ... high-pass filter, 13-1 to 13-4 ... filter bank, 14 ... gain detection section, 14a ... buffer memory, 14b, 14b-a, 14b-b, 14b-c ... correction function calculation section, 15-1 to 15-4 ... Gain control unit, 16-1 to 16-4 ... MDCT processing unit, 17-1 to 17-4 ... Tone component encoder, 18-1 to 18-4 ... Tone component quantization , 19-1 to 19-4 ... Spectral quantizer, 20 ... Bitstream multiplexer, 21 ... Bitstream demultiplexer 22-1 to 22-4 ... Tone component dequantizer, 23-1 to 23-4 ... Spectral dequantizer, 24-1 to 24-4 ... Tone component decoder, 25-1 to 25-4 Inverse MDCT processing unit, 26-1 to 26-4 ... Inverse gain control unit, 27 ... QMF synthesis filter, CO1, CO2 ... Cascade operator, MP1a, MP1b, MP1c, MP2a, MP2b,
MP2c ... Multiplier.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 スア ホン・ネオ シンガポール534415シンガポール、タイ・ セン・アベニュー、ブロック1022、04− 3530番、タイ・セン・インダストリアル・ エステイト、パナソニック・シンガポール 研究所株式会社内 Fターム(参考) 5D045 DA20 5J064 BA16 BB07 BB12 BC01 BC02 BC06 BC07 BC09 BC12 BC16 BC25 BC29 BD03    ─────────────────────────────────────────────────── ─── Continued front page    (72) Inventor Suahone Neo             Singapore 534415 Singapore, Thailand             Sen Avenue, Block 1022, 04-             No. 3530, Thai Sen Industrial             Estate, Panasonic Singapore             Research Institute Co., Ltd. F-term (reference) 5D045 DA20                 5J064 BA16 BB07 BB12 BC01 BC02                       BC06 BC07 BC09 BC12 BC16                       BC25 BC29 BD03


RetroSearch is an open source project built by @garambo | Open a GitHub Issue

Search and Browse the WWW like it's 1997 | Search results from DuckDuckGo

HTML: 3.2 | Encoding: UTF-8 | Version: 0.7.4