ÐблаÑÑÑ ÑÐµÑ Ð½Ð¸ÐºÐ¸, к коÑоÑой оÑноÑиÑÑÑ Ð¸Ð·Ð¾Ð±ÑеÑениеFIELD OF THE INVENTION
ÐÑÐµÐ´Ð¼ÐµÑ ÑÑой заÑвки оÑноÑиÑÑÑ Ð² обÑем к обÑабоÑке аÑдиоÑигнала.The subject matter of this application relates generally to audio processing.
УÑÐ¾Ð²ÐµÐ½Ñ ÑÐµÑ Ð½Ð¸ÐºÐ¸State of the art
РнаÑÑоÑÑее вÑÐµÐ¼Ñ Ð¿ÑоводÑÑÑÑ Ð¸ÑÑÐ»ÐµÐ´Ð¾Ð²Ð°Ð½Ð¸Ñ Ð¸ ÑазÑабаÑÑваÑÑÑÑ Ð½Ð¾Ð²Ñе Ð¿Ð¾Ð´Ñ Ð¾Ð´Ñ Ðº пеÑÑепÑÐ¸Ð²Ð½Ð¾Ð¼Ñ ÐºÐ¾Ð´Ð¸ÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¼Ð½Ð¾Ð³Ð¾ÐºÐ°Ð½Ð°Ð»Ñного аÑдиоÑигнала, коÑоÑое обÑÑно назÑваÑÑ Ð¿ÑоÑÑÑанÑÑвеннÑм аÑдиокодиÑованием (SAC). SAC Ð´Ð°ÐµÑ Ð²Ð¾Ð·Ð¼Ð¾Ð¶Ð½Ð¾ÑÑÑ Ð¿ÐµÑедаваÑÑ Ð¼Ð½Ð¾Ð³Ð¾ÐºÐ°Ð½Ð°Ð»ÑнÑй аÑдиоÑигнал Ñ Ð½Ð¸Ð·ÐºÐ¸Ð¼Ð¸ ÑкоÑоÑÑÑми пеÑедаÑи биÑов, ÑÑо позволÑÐµÑ Ð¸ÑполÑзоваÑÑ SAC Ð´Ð»Ñ Ð¼Ð½Ð¾Ð³Ð¸Ñ Ð¿Ð¾Ð¿ÑлÑÑнÑÑ Ð°ÑдиопÑиложений (напÑимеÑ, поÑÐ¾ÐºÐ¾Ð²Ð°Ñ Ð¿ÐµÑедаÑа ÑеÑез ÐнÑеÑнеÑ, ÑкаÑивание мÑзÑки).Research is currently underway and new approaches are being developed for perceptual coding of multi-channel audio, which is commonly referred to as spatial audio coding (SAC). SAC allows you to transmit multi-channel audio with low bit rates, which allows you to use SAC for many popular audio applications (for example, streaming over the Internet, downloading music).
ÐмеÑÑо вÑÐ¿Ð¾Ð»Ð½ÐµÐ½Ð¸Ñ Ð´Ð¸ÑкÑеÑного кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¾ÑделÑнÑÑ Ð²Ñ Ð¾Ð´Ð½ÑÑ Ð°Ñдиоканалов, пÑи иÑполÑзовании SAC ÑикÑиÑÑеÑÑÑ Ð¿ÑоÑÑÑанÑÑвенное изобÑажение многоканалÑного аÑдиоÑигнала в компакÑном набоÑе паÑамеÑÑов. ÐÑи паÑамеÑÑÑ Ð¼Ð¾Ð³ÑÑ Ð¿ÐµÑедаваÑÑÑÑ Ð² декодеÑ, где они иÑполÑзÑÑÑÑÑ Ð´Ð»Ñ ÑинÑеза или воÑÑÑÐ°Ð½Ð¾Ð²Ð»ÐµÐ½Ð¸Ñ Ð¿ÑоÑÑÑанÑÑвеннÑÑ ÑвойÑÑв аÑдиоÑигнала.Instead of performing discrete coding of individual input audio channels, when using SAC, a spatial image of a multi-channel audio signal is recorded in a compact set of parameters. These parameters can be transmitted to the decoder, where they are used to synthesize or restore the spatial properties of the audio signal.
РнекоÑоÑÑÑ Ð¿ÑиложениÑÑ , оÑноÑÑÑÐ¸Ñ ÑÑ Ðº SAC, пÑоÑÑÑанÑÑвеннÑе паÑамеÑÑÑ Ð¿ÐµÑедаÑÑÑÑ Ð² Ð´ÐµÐºÐ¾Ð´ÐµÑ Ð² виде ÑаÑÑи биÑового поÑока. ÐиÑовÑй поÑок вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¿ÑоÑÑÑанÑÑвеннÑе кадÑÑ, коÑоÑÑе ÑодеÑÐ¶Ð°Ñ ÑпоÑÑдоÑеннÑе набоÑÑ Ð²ÑеменнÑÑ Ð¸Ð½ÑеÑвалов, Ð´Ð»Ñ ÐºÐ¾ÑоÑÑÑ Ð¼Ð¾Ð³ÑÑ Ð¿ÑименÑÑÑÑÑ Ð½Ð°Ð±Ð¾ÑÑ Ð¿ÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑов. ÐиÑовÑй поÑок Ñакже вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ положении, коÑоÑÐ°Ñ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¸ÑполÑзована декодеÑом Ð´Ð»Ñ Ð¸Ð´ÐµÐ½ÑиÑикаÑии пÑавилÑного вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð·Ð°Ð´Ð°Ð½Ð½Ñй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов.In some SAC related applications, spatial parameters are transmitted to the decoder as part of the bitstream. The bitstream includes spatial frames that contain ordered sets of time intervals for which sets of spatial parameters can be applied. The bitstream also includes position information that can be used by the decoder to identify the correct time interval for which a given set of parameters is applied.
РнекоÑоÑÑÑ Ð¿ÑиложениÑÑ SAC в ÑÑакÑÐ°Ñ ÐºÐ¾Ð´Ð¸ÑованиÑ/декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ÑполÑзÑÑÑ ÐºÐ¾Ð½ÑепÑÑалÑнÑе ÑлеменÑÑ. Ðдин ÑÐ»ÐµÐ¼ÐµÐ½Ñ Ð¾Ð±ÑÑно назÑваеÑÑÑ ÑлеменÑом «один к двÑм» (OTT), а дÑÑгой ÑÐ»ÐµÐ¼ÐµÐ½Ñ Ð¾Ð±ÑÑно назÑваÑÑ ÑлеменÑом «два к ÑÑем» (TTT), где ÑказаннÑе имена заклÑÑаÑÑ Ð² Ñебе колиÑеÑÑво Ð²Ñ Ð¾Ð´Ð½ÑÑ Ð¸ вÑÑ Ð¾Ð´Ð½ÑÑ Ñигналов ÑооÑвеÑÑÑвÑÑÑего ÑлеменÑа декодеÑа. ÐÐ»ÐµÐ¼ÐµÐ½Ñ ÐºÐ¾Ð´ÐµÑа OTT вÑделÑÐµÑ Ð´Ð²Ð° пÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑа и ÑÐ¾Ð·Ð´Ð°ÐµÑ Ñигнал, ÑвлÑÑÑийÑÑ ÑезÑлÑÑаÑом понижаÑÑего микÑиÑованиÑ, и оÑÑаÑоÑнÑй Ñигнал. ÐÐ»ÐµÐ¼ÐµÐ½Ñ TTT вÑполнÑÐµÑ Ð¿Ð¾Ð½Ð¸Ð¶Ð°ÑÑее микÑиÑование ÑÑÐµÑ Ð°ÑдиоÑигналов, в ÑезÑлÑÑаÑе Ñего полÑÑаÑÑ ÑÑеÑеоÑигнал поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿Ð»ÑÑ Ð¾ÑÑаÑоÑнÑй Ñигнал. ÐÑи ÑлеменÑÑ Ð¼Ð¾Ð³ÑÑ Ð±ÑÑÑ Ð¾Ð±ÑÐµÐ´Ð¸Ð½ÐµÐ½Ñ Ð´Ð»Ñ ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ ÑазнообÑазнÑÑ ÐºÐ¾Ð½ÑигÑÑаÑий пÑоÑÑÑанÑÑвенной аÑдиоÑÑÐµÐ´Ñ (напÑимеÑ, обÑемного звÑка).In some SAC applications, conceptual elements are used in the coding / decoding paths. One element is usually called a one-to-two (OTT) element, and the other element is usually called a two-to-three (TTT) element, where these names include the number of input and output signals of the corresponding decoder element. The OTT encoder element extracts two spatial parameters and produces a signal resulting from the downmix and a residual signal. The TTT element down-mixes the three audio signals, resulting in a stereo signal after down-mixing plus a residual signal. These elements can be combined to create a variety of spatial audio environment configurations (such as surround sound).
ÐекоÑоÑÑе пÑÐ¸Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ SAC могÑÑ ÑабоÑаÑÑ Ð² неÑпÑавлÑемом ÑабоÑем Ñежиме, когда из кодеÑа в Ð´ÐµÐºÐ¾Ð´ÐµÑ Ð¿ÐµÑедаеÑÑÑ ÑолÑко ÑÑеÑеоÑигнал поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð±ÐµÐ· Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾ÑÑи пеÑедаÑи пÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑов. ÐÐµÐºÐ¾Ð´ÐµÑ ÑинÑезиÑÑÐµÑ Ð¿ÑоÑÑÑанÑÑвеннÑе паÑамеÑÑÑ Ð¸Ð· Ñигнала, полÑÑенного в ÑезÑлÑÑаÑе понижаÑÑего микÑиÑованиÑ, и иÑполÑзÑÐµÑ ÑÑи паÑамеÑÑÑ Ð´Ð»Ñ ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ Ð¼Ð½Ð¾Ð³Ð¾ÐºÐ°Ð½Ð°Ð»Ñного аÑдиоÑигнала.Some SAC applications can operate in uncontrolled operating mode, when only the stereo signal is transmitted from the encoder to the decoder after down-mixing without the need for spatial parameters. The decoder synthesizes spatial parameters from the signal obtained as a result of the down-mix, and uses these parameters to create a multi-channel audio signal.
СÑÑноÑÑÑ Ð¸Ð·Ð¾Ð±ÑеÑениÑSUMMARY OF THE INVENTION
ÐÑоÑÑÑанÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð¸Ð½ÑоÑмаÑиÑ, ÑвÑÐ·Ð°Ð½Ð½Ð°Ñ Ñ Ð°ÑдиоÑигналом, кодиÑÑеÑÑÑ Ð² биÑовÑй поÑок, коÑоÑÑй Ð¼Ð¾Ð¶ÐµÑ Ð¿ÐµÑедаваÑÑÑÑ Ð² Ð´ÐµÐºÐ¾Ð´ÐµÑ Ð¸Ð»Ð¸ запиÑÑваÑÑÑÑ Ð½Ð° ноÑиÑеле даннÑÑ . ÐиÑовÑй поÑок Ð¼Ð¾Ð¶ÐµÑ ÑодеÑжаÑÑ Ð² Ñебе ÑазлиÑнÑй ÑинÑакÑиÑ, оÑноÑÑÑийÑÑ Ðº вÑеменной, ÑаÑÑоÑной и пÑоÑÑÑанÑÑвенной облаÑÑÑм. РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð±Ð¸ÑовÑй поÑок вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¾Ð´Ð½Ñ Ð¸Ð»Ð¸ неÑколÑко ÑÑÑÑкÑÑÑ Ð´Ð°Ð½Ð½ÑÑ (напÑимеÑ, кадÑÑ), коÑоÑÑе ÑодеÑÐ¶Ð°Ñ ÑпоÑÑдоÑеннÑе набоÑÑ Ð²ÑеменнÑÑ Ð¸Ð½ÑеÑвалов, Ð´Ð»Ñ ÐºÐ¾ÑоÑÑÑ Ð¼Ð¾Ð¶Ð½Ð¾ пÑименÑÑÑ Ñе или инÑе паÑамеÑÑÑ. ÐÑи ÑÑÑÑкÑÑÑÑ Ð´Ð°Ð½Ð½ÑÑ Ð¼Ð¾Ð³ÑÑ Ð±ÑÑÑ ÑикÑиÑованнÑми или пеÑеменнÑми. ÐндикаÑÐ¾Ñ Ñипа ÑÑÑÑкÑÑÑÑ Ð´Ð°Ð½Ð½ÑÑ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²ÑÑавлен в биÑовÑй поÑок, ÑÑÐ¾Ð±Ñ Ð´Ð°ÑÑ Ð²Ð¾Ð·Ð¼Ð¾Ð¶Ð½Ð¾ÑÑÑ Ð´ÐµÐºÐ¾Ð´ÐµÑÑ Ð¾Ð¿ÑеделиÑÑ Ñип ÑÑÑÑкÑÑÑÑ Ð´Ð°Ð½Ð½ÑÑ Ð¸ иниÑииÑоваÑÑ ÑооÑвеÑÑÑвÑÑÑий пÑоÑеÑÑ Ð´ÐµÐºÐ¾Ð´Ð¸ÑованиÑ. СÑÑÑкÑÑÑа даннÑÑ Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ положении, коÑоÑÐ°Ñ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¸ÑполÑзована декодеÑом Ð´Ð»Ñ Ð¸Ð´ÐµÐ½ÑиÑикаÑии пÑавилÑного вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименим заданнÑй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов. ÐнÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменного инÑеÑвала Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð·Ð°ÐºÐ¾Ð´Ð¸Ñована Ñ Ð¸ÑполÑзованием ÑикÑиÑованного колиÑеÑÑва Ð±Ð¸Ñ Ð¸Ð»Ð¸ пеÑеменного колиÑеÑÑва Ð±Ð¸Ñ Ð² завиÑимоÑÑи Ð¾Ñ Ñипа ÑÑÑÑкÑÑÑÑ Ð´Ð°Ð½Ð½ÑÑ , Ñказанного индикаÑоÑом Ñипа ÑÑÑÑкÑÑÑÑ Ð´Ð°Ð½Ð½ÑÑ . ÐÐ»Ñ ÑÑÑÑкÑÑÑÑ Ð´Ð°Ð½Ð½ÑÑ Ð¿ÐµÑеменного Ñипа инÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменного инÑеÑвала Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð·Ð°ÐºÐ¾Ð´Ð¸Ñована Ñ Ð¸ÑполÑзованием пеÑеменного колиÑеÑÑва Ð±Ð¸Ñ Ð½Ð° оÑнове Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð²Ñеменного инÑеÑвала в ÑпоÑÑдоÑенном набоÑе вÑеменнÑÑ Ð¸Ð½ÑеÑвалов.The spatial information associated with the audio signal is encoded into a bitstream that can be transmitted to a decoder or recorded on a storage medium. The bitstream may contain various syntax related to the time, frequency and spatial domains. In some embodiments, the bitstream includes one or more data structures (eg, frames) that contain ordered sets of time slots for which certain parameters can be applied. These data structures can be fixed or variable. An indicator of the type of data structure can be inserted into the bitstream to enable the decoder to determine the type of data structure and initiate the corresponding decoding process. The data structure may include position information that can be used by the decoder to identify the correct time interval for which a given set of parameters is applicable. The information about the position of the time interval can be encoded using a fixed number of bits or a variable number of bits depending on the type of data structure indicated by the indicator of the type of data structure. For a variable-type data structure, time slot position information can be encoded using a variable number of bits based on the position of the time slot in an ordered set of time slots.
РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ ÑеализаÑии ÑпоÑоб кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð°ÑдиоÑигнала вклÑÑÐ°ÐµÑ Ð² ÑебÑ: опÑеделение колиÑеÑÑва вÑеменнÑÑ Ð¸Ð½ÑеÑвалов и колиÑеÑÑва набоÑов паÑамеÑÑов, пÑиÑем набоÑÑ Ð¿Ð°ÑамеÑÑов вклÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð¾Ð´Ð¸Ð½ или неÑколÑко паÑамеÑÑов; Ñоздание инÑоÑмаÑии, ÑказÑваÑÑей положение по менÑÑей меÑе одного вÑеменного инÑеÑвала в ÑпоÑÑдоÑенном набоÑе вÑеменнÑÑ Ð¸Ð½ÑеÑвалов, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов; кодиÑование аÑдиоÑигнала в виде биÑового поÑока, вклÑÑаÑÑего в ÑÐµÐ±Ñ ÐºÐ°Ð´Ñ, пÑиÑем ÑÑÐ¾Ñ ÐºÐ°Ð´Ñ ÑодеÑÐ¶Ð¸Ñ ÑпоÑÑдоÑеннÑй Ð½Ð°Ð±Ð¾Ñ Ð²ÑеменнÑÑ Ð¸Ð½ÑеÑвалов; и вÑÑÐ°Ð²ÐºÑ Ð¿ÐµÑеменного колиÑеÑÑва Ð±Ð¸Ñ Ð² биÑовÑй поÑок, коÑоÑÑе пÑедÑÑавлÑÑÑ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ðµ вÑеменного инÑеÑвала в ÑпоÑÑдоÑенном набоÑе вÑеменнÑÑ Ð¸Ð½ÑеÑвалов, где пеÑеменное колиÑеÑÑво Ð±Ð¸Ñ Ð¾Ð¿ÑеделÑеÑÑÑ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸ÐµÐ¼ вÑеменного инÑеÑвала.In some embodiments, an audio encoding method includes: determining the number of time slots and the number of parameter sets, the parameter sets including one or more parameters; creating information indicating the position of at least one time interval in an ordered set of time intervals for which a set of parameters is applied; encoding an audio signal in the form of a bit stream including a frame, this frame comprising an ordered set of time intervals; and inserting a variable number of bits into the bitstream, which represent the position of the time interval in an ordered set of time intervals, where the variable number of bits is determined by the position of the time interval.
РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð¸Ð·Ð¾Ð±ÑеÑÐµÐ½Ð¸Ñ ÑпоÑоб декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð°ÑдиоÑигнала вклÑÑÐ°Ñ Ð² ÑебÑ: пÑием биÑового поÑока, пÑедÑÑавлÑÑÑего аÑдиоÑигнал, пÑиÑем биÑовÑй поÑок ÑодеÑÐ¶Ð¸Ñ ÐºÐ°Ð´Ñ; опÑеделение колиÑеÑÑва вÑеменнÑÑ Ð¸Ð½ÑеÑвалов и колиÑеÑÑво набоÑов паÑамеÑÑов из биÑового поÑока, пÑиÑем набоÑÑ Ð¿Ð°ÑамеÑÑов вклÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð¾Ð´Ð¸Ð½ или неÑколÑко паÑамеÑÑов; опÑеделение инÑоÑмаÑии о положении из биÑового поÑока, пÑиÑем инÑоÑмаÑÐ¸Ñ Ð¾ положении ÑказÑÐ²Ð°ÐµÑ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ðµ вÑеменного инÑеÑвала в ÑпоÑÑдоÑенном набоÑе вÑеменнÑÑ Ð¸Ð½ÑеÑвалов, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ ÑказаннÑй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, где ÑпоÑÑдоÑеннÑй Ð½Ð°Ð±Ð¾Ñ Ð²ÑеменнÑÑ Ð¸Ð½ÑеÑвалов ÑодеÑжиÑÑÑ Ð² Ñказанном кадÑе; и декодиÑование аÑдиоÑигнала на оÑнове колиÑеÑÑва вÑеменнÑÑ Ð¸Ð½ÑеÑвалов, колиÑеÑÑва набоÑов паÑамеÑÑов и инÑоÑмаÑии о положении, где инÑоÑмаÑÐ¸Ñ Ð¾ положении пÑедÑÑавлена пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ Ð½Ð° оÑнове Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð²Ñеменного инÑеÑвала.In some embodiments of the invention, a method for decoding an audio signal includes: receiving a bit stream representing an audio signal, the bit stream comprising a frame; determining the number of time slots and the number of parameter sets from the bitstream, the parameter sets including one or more parameters; determining position information from the bitstream, wherein the position information indicates a position of a time interval in an ordered set of time intervals for which a specified set of parameters is applied, where an ordered set of time intervals is contained in the specified frame; and decoding the audio signal based on the number of time slots, the number of parameter sets and position information, where the position information is represented by a variable number of bits based on the position of the time interval.
РаÑкÑÑÑÑ Ð´ÑÑгие ваÑианÑÑ ÐºÐ¾Ð´Ð¸ÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð²Ñеменного инÑеÑвала, коÑоÑÑе оÑноÑÑÑÑÑ Ðº ÑиÑÑемам, ÑпоÑобам, ÑÑÑÑойÑÑвам, ÑÑÑÑкÑÑÑам даннÑÑ Ð¸ ÑÑиÑÑваемÑм компÑÑÑеÑом ноÑиÑелÑм.Disclosed are other options for encoding the position of the time interval, which relate to systems, methods, devices, data structures and computer-readable media.
СледÑÐµÑ Ð¿Ð¾Ð½Ð¸Ð¼Ð°ÑÑ, ÑÑо пÑедÑеÑÑвÑÑÑее обÑее опиÑание и поÑледÑÑÑее подÑобное опиÑание ваÑианÑов изобÑеÑÐµÐ½Ð¸Ñ Ð½Ð¾ÑÑÑ Ð¸Ð»Ð»ÑÑÑÑаÑивнÑй и поÑÑниÑелÑнÑй Ñ Ð°ÑакÑÐµÑ Ð¸ пÑедполагаÑÑ Ð´Ð¾Ð¿Ð¾Ð»Ð½Ð¸ÑелÑное ÑазÑÑÑнение заÑвленного изобÑеÑениÑ.It should be understood that the foregoing general description and the following detailed description of embodiments of the invention are illustrative and explanatory and suggest further clarification of the claimed invention.
ÐÑаÑкое опиÑание ÑеÑÑежейBrief Description of the Drawings
СопÑоводиÑелÑнÑе ÑеÑÑежи, коÑоÑÑе вклÑÑÐµÐ½Ñ ÑÑда Ð´Ð»Ñ Ð±Ð¾Ð»ÐµÐµ глÑбокого Ð¿Ð¾Ð½Ð¸Ð¼Ð°Ð½Ð¸Ñ Ð¸Ð·Ð¾Ð±ÑеÑÐµÐ½Ð¸Ñ Ð¸ обÑазÑÑÑ ÑаÑÑÑ Ð´Ð°Ð½Ð½Ð¾Ð¹ заÑвки, иллÑÑÑÑиÑÑÑÑ Ð²Ð°ÑÐ¸Ð°Ð½Ñ (ваÑианÑÑ) оÑÑÑеÑÑÐ²Ð»ÐµÐ½Ð¸Ñ Ð¸Ð·Ð¾Ð±ÑеÑÐµÐ½Ð¸Ñ Ð¸ вмеÑÑе Ñ Ð¾Ð¿Ð¸Ñанием ÑлÑÐ¶Ð°Ñ Ð´Ð»Ñ Ð¾Ð±ÑÑÑÐ½ÐµÐ½Ð¸Ñ Ð¿ÑинÑипов, лежаÑÐ¸Ñ Ð² оÑнове наÑÑоÑÑего изобÑеÑениÑ. Ðа ÑеÑÑÐµÐ¶Ð°Ñ :The accompanying drawings, which are included here for a deeper understanding of the invention and form part of this application, illustrate an embodiment (s) of the invention and together with the description serve to explain the principles underlying the present invention. In the drawings:
Ñиг. 1 - ÑÑ ÐµÐ¼Ð°, иллÑÑÑÑиÑÑÑÑÐ°Ñ Ð¿ÑинÑип ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑии ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 1 is a diagram illustrating the principle of creating spatial information according to one embodiment of the present invention;
Ñиг. 2 - блок-ÑÑ ÐµÐ¼Ð° кодеÑа Ð´Ð»Ñ ÐºÐ¾Ð´Ð¸ÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð°ÑдиоÑигнала ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 2 is a block diagram of an encoder for encoding an audio signal according to one embodiment of the present invention;
Ñиг. 3 - блок-ÑÑ ÐµÐ¼Ð° декодеÑа Ð´Ð»Ñ Ð´ÐµÐºÐ¾Ð´Ð¸ÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð°ÑдиоÑигнала ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 3 is a block diagram of a decoder for decoding an audio signal according to one embodiment of the present invention;
Ñиг. 4 - блок-ÑÑ ÐµÐ¼Ð° модÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð², ÑодеÑжаÑегоÑÑ Ð² блоке повÑÑаÑÑего микÑиÑованиÑ, Ð²Ñ Ð¾Ð´ÑÑем в декодеÑ, ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 4 is a block diagram of a channel conversion module contained in an upmix unit included in a decoder according to one embodiment of the present invention;
Ñиг. 5 - ÑÑ ÐµÐ¼Ð°, обÑÑÑнÑÑÑÐ°Ñ ÑпоÑоб конÑигÑÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð±Ð¸Ñового поÑока аÑдиоÑигнала ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 5 is a diagram explaining a method for configuring an audio bitstream according to one embodiment of the present invention;
Ñиг. 6Ри 6Ð - ÑÑ ÐµÐ¼Ð° и гÑаÑик вÑемÑ/ÑаÑÑоÑа, обÑÑÑнÑÑÑие взаимоÑвÑзи Ð¼ÐµÐ¶Ð´Ñ Ð½Ð°Ð±Ð¾Ñом паÑамеÑÑов, вÑеменнÑм инÑеÑвалом и паÑамеÑÑиÑеÑкими диапазонами ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 6A and 6B are a time / frequency diagram and graph explaining the relationships between a set of parameters, a time interval, and parametric ranges according to one embodiment of the present invention;
Ñиг. 7Ð - иллÑÑÑÑаÑÐ¸Ñ ÑинÑакÑиÑа, пÑедÑÑавлÑÑÑего инÑоÑмаÑÐ¸Ñ Ð¾ конÑигÑÑаÑии пÑоÑÑÑанÑÑвенного инÑоÑмаÑионного Ñигнала ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 7A is an illustration of a syntax representing spatial information signal configuration information according to one embodiment of the present invention;
Ñиг. 7Ð - ÑаблиÑа Ð´Ð»Ñ Ð½ÐµÑколÑÐºÐ¸Ñ Ð¿Ð°ÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² пÑоÑÑÑанÑÑвенного инÑоÑмаÑионного Ñигнала ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 7B is a table for several parametric ranges of a spatial information signal according to one embodiment of the present invention;
Ñиг. 8Ð - иллÑÑÑÑаÑÐ¸Ñ ÑинÑакÑиÑа, пÑедÑÑавлÑÑÑего неÑколÑко паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименимÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° OTT, в виде ÑикÑиÑованного колиÑеÑÑва Ð±Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 8A is an illustration of a syntax representing several parametric ranges applicable to an OTT block as a fixed number of bits according to one embodiment of the present invention;
Ñиг. 8Ð - иллÑÑÑÑаÑÐ¸Ñ ÑинÑакÑиÑа, пÑедÑÑавлÑÑÑего неÑколÑко паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименимÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° OTT, Ñ Ð¿Ð¾Ð¼Ð¾ÑÑÑ Ð¿ÐµÑеменного колиÑеÑÑва Ð±Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 8B is an illustration of a syntax representing several parametric ranges applicable to an OTT block using a variable number of bits according to one embodiment of the present invention;
Ñиг. 9Ð - иллÑÑÑÑаÑÐ¸Ñ ÑинÑакÑиÑа, пÑедÑÑавлÑÑÑего неÑколÑко паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименимÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° TTT, в виде ÑикÑиÑованного колиÑеÑÑва Ð±Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 9A is an illustration of a syntax representing several parametric ranges applicable to a TTT block as a fixed number of bits in accordance with one embodiment of the present invention;
Ñиг. 9Ð - иллÑÑÑÑаÑÐ¸Ñ ÑинÑакÑиÑа, пÑедÑÑавлÑÑÑего неÑколÑко паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименимÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° TTT, Ñ Ð¿Ð¾Ð¼Ð¾ÑÑÑ Ð¿ÐµÑеменного колиÑеÑÑва Ð±Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 9B is an illustration of a syntax representing several parametric ranges applicable to a TTT block using a variable number of bits according to one embodiment of the present invention;
Ñиг. 10Ð - иллÑÑÑÑаÑÐ¸Ñ ÑинÑакÑиÑа инÑоÑмаÑии о конÑигÑÑаÑии пÑоÑÑÑанÑÑвенного ÑаÑÑиÑÐµÐ½Ð¸Ñ Ð´Ð»Ñ ÐºÐ°Ð´Ñа пÑоÑÑÑанÑÑвенного ÑаÑÑиÑÐµÐ½Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 10A is an illustration of the syntax of spatial extension configuration information for a spatial extension frame according to one embodiment of the present invention;
Ñиг. 10Ри 10С - иллÑÑÑÑаÑии ÑинÑакÑиÑов инÑоÑмаÑии о конÑигÑÑаÑии пÑоÑÑÑанÑÑвенного ÑаÑÑиÑÐµÐ½Ð¸Ñ Ð´Ð»Ñ Ð¾ÑÑаÑоÑного Ñигнала в Ñом ÑлÑÑае, когда оÑÑаÑоÑнÑй Ñигнал ÑодеÑжиÑÑÑ Ð² кадÑе пÑоÑÑÑанÑÑвенного ÑаÑÑиÑÐµÐ½Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 10B and 10C illustrate syntaxes of spatial extension configuration information for a residual signal when the residual signal is contained in a spatial extension frame according to one embodiment of the present invention;
Ñиг. 10D - иллÑÑÑÑаÑÐ¸Ñ ÑинÑакÑиÑа Ð´Ð»Ñ ÑпоÑоба пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð´Ð»Ñ Ð¾ÑÑаÑоÑного Ñигнала ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 10D illustrates syntax for a method for representing the number of parametric ranges for a residual signal according to one embodiment of the present invention;
Ñиг. 11Ð - блок-ÑÑ ÐµÐ¼Ð° ÑÑÑÑойÑÑва декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿Ñи иÑполÑзовании неÑпÑавлÑемого кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 11A is a block diagram of a decoding apparatus using uncontrolled coding according to one embodiment of the present invention;
Ñиг. 11Ð - ÑÑ ÐµÐ¼Ð° Ð´Ð»Ñ ÑпоÑоба пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² в виде одной гÑÑÐ¿Ð¿Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 11B is a diagram for a method for representing the number of parametric ranges in a single group according to one embodiment of the present invention;
Ñиг. 12 - иллÑÑÑÑаÑÐ¸Ñ ÑинÑакÑиÑа инÑоÑмаÑии о конÑигÑÑаÑии пÑоÑÑÑанÑÑвенного кадÑа ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 12 is an illustration of the syntax of spatial frame configuration information according to one embodiment of the present invention;
Ñиг. 13Ð - иллÑÑÑÑаÑÐ¸Ñ ÑинÑакÑиÑа инÑоÑмаÑии о положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 13A is an illustration of a syntax of position information of a time interval for which a set of parameters is applied, according to one embodiment of the present invention;
Ñиг. 13Ð - иллÑÑÑÑаÑÐ¸Ñ ÑинÑакÑиÑа Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¸Ð½ÑоÑмаÑии о положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, в виде абÑолÑÑного знаÑÐµÐ½Ð¸Ñ Ð¸ знаÑÐµÐ½Ð¸Ñ ÑазноÑÑи ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 13B is an illustration of a syntax for presenting position information of a time interval for which a set of parameters is applied as an absolute value and a difference value according to one embodiment of the present invention;
Ñиг. 13С - ÑÑ ÐµÐ¼Ð°, пÑедÑÑавлÑÑÑÐ°Ñ Ð¼Ð½Ð¾Ð¶ÐµÑÑво инÑоÑмаÑий о положении вÑеменнÑÑ Ð¸Ð½ÑеÑвалов, Ð´Ð»Ñ ÐºÐ¾ÑоÑÑÑ Ð¿ÑименÑÑÑÑÑ Ð½Ð°Ð±Ð¾ÑÑ Ð¿Ð°ÑамеÑÑов, в виде гÑÑÐ¿Ð¿Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 13C is a diagram representing a plurality of information about the position of time intervals for which sets of parameters are applied in the form of a group according to one embodiment of the present invention;
Ñиг. 14 - блок-ÑÑ ÐµÐ¼Ð° ÑпоÑоба кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ;FIG. 14 is a flowchart of an encoding method according to one embodiment of the present invention;
Ñиг. 15 - блок-ÑÑ ÐµÐ¼Ð° ÑпоÑоба декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ; иFIG. 15 is a flowchart of a decoding method according to one embodiment of the present invention; and
Ñиг. 16 - блок-ÑÑ ÐµÐ¼Ð° аÑÑ Ð¸ÑекÑÑÑÑ ÑÑÑÑойÑÑва Ð´Ð»Ñ ÑеализаÑии пÑоÑеÑÑов кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ декодиÑованиÑ, опиÑаннÑÑ Ñо ÑÑÑлками на ÑигÑÑÑ 1-15.FIG. 16 is a block diagram of a device architecture for implementing the encoding and decoding processes described with reference to FIGS. 1-15.
ÐаилÑÑÑий ваÑÐ¸Ð°Ð½Ñ Ð¾ÑÑÑеÑÑÐ²Ð»ÐµÐ½Ð¸Ñ Ð¸Ð·Ð¾Ð±ÑеÑениÑBest Mode for Carrying Out the Invention
Ðа Ñиг. 1 пÑедÑÑавлена ÑÑ ÐµÐ¼Ð°, иллÑÑÑÑиÑÑÑÑÐ°Ñ Ð¿ÑинÑип ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑии ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. Ð¡Ñ ÐµÐ¼Ð° пеÑÑепÑивного кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð´Ð»Ñ Ð¼Ð½Ð¾Ð³Ð¾ÐºÐ°Ð½Ð°Ð»ÑнÑÑ Ð°ÑдиоÑигналов оÑнована на Ñом ÑакÑе, ÑÑо Ñеловек Ð¼Ð¾Ð¶ÐµÑ Ð²Ð¾ÑпÑинимаÑÑ Ð°ÑдиоÑÐ¸Ð³Ð½Ð°Ð»Ñ ÑеÑез ÑÑÐµÑ Ð¼ÐµÑное пÑоÑÑÑанÑÑво. ÐÑо ÑÑÐµÑ Ð¼ÐµÑное пÑоÑÑÑанÑÑве аÑдиоÑигнала можно пÑедÑÑавиÑÑ Ñ Ð¸ÑполÑзованием пÑоÑÑÑанÑÑвенной инÑоÑмаÑии, вклÑÑаÑÑей в ÑебÑ, но не ÑолÑко, ÑледÑÑÑие извеÑÑнÑе пÑоÑÑÑанÑÑвеннÑе паÑамеÑÑÑ: ÑазноÑÑи каналÑнÑÑ ÑÑовней (CLD), межканалÑнÑÑ ÐºÐ¾ÑÑелÑÑиÑ/когеÑенÑноÑÑÑ (ICC), ÑазновÑеменноÑÑÑ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² (CTD), коÑÑÑиÑиенÑÑ ÐºÐ°Ð½Ð°Ð»Ñного пÑедÑÐºÐ°Ð·Ð°Ð½Ð¸Ñ (CPC) и Ñ.д. ÐаÑамеÑÑ CLD опиÑÑÐ²Ð°ÐµÑ ÑазноÑÑи в ÑнеÑгии (ÑÑовне) Ð¼ÐµÐ¶Ð´Ñ Ð´Ð²ÑÐ¼Ñ Ð°Ñдиоканалами, паÑамеÑÑ ICC опиÑÑÐ²Ð°ÐµÑ Ð²ÐµÐ»Ð¸ÑÐ¸Ð½Ñ ÐºÐ¾ÑÑелÑÑии или когеÑенÑноÑÑи Ð¼ÐµÐ¶Ð´Ñ Ð´Ð²ÑÐ¼Ñ Ð°Ñдиоканалами, а паÑамеÑÑ CTD опиÑÑÐ²Ð°ÐµÑ ÑазноÑÑÑ Ð¿Ð¾ вÑемени Ð¼ÐµÐ¶Ð´Ñ Ð´Ð²ÑÐ¼Ñ Ð°Ñдиоканалами.In FIG. 1 is a diagram illustrating the principle of creating spatial information according to one embodiment of the present invention. The perceptual coding scheme for multichannel audio signals is based on the fact that a person can perceive audio signals through three-dimensional space. This three-dimensional space of the audio signal can be represented using spatial information, including, but not limited to, the following known spatial parameters: channel level differences (CLD), inter-channel correlation / coherence (ICC), channel variance (CTD), channel prediction coefficients (CPC) ) etc. The CLD parameter describes the differences in energy (level) between the two audio channels, the ICC parameter describes the correlation or coherence between the two audio channels, and the CTD parameter describes the time difference between the two audio channels.
Создание паÑамеÑÑов CTD и CLD показано на Ñиг. 1. ÐеÑÐ²Ð°Ñ Ð¿ÑÑÐ¼Ð°Ñ Ð·Ð²ÑÐºÐ¾Ð²Ð°Ñ Ð²Ð¾Ð»Ð½Ð° 103 Ð¾Ñ Ñдаленного иÑÑоÑника 101 звÑка поÑÑÑÐ¿Ð°ÐµÑ Ð² левое ÑеловеÑеÑкое ÑÑ Ð¾ 107, а вÑоÑÐ°Ñ Ð¿ÑÑÐ¼Ð°Ñ Ð·Ð²ÑÐºÐ¾Ð²Ð°Ñ Ð²Ð¾Ð»Ð½Ð° 102 диÑÑагиÑÑÐµÑ Ð²Ð¾ÐºÑÑг Ð³Ð¾Ð»Ð¾Ð²Ñ Ñеловека, доÑÑÐ¸Ð³Ð°Ñ ÐµÐ³Ð¾ пÑавого ÑÑ Ð° 106. ÐÑÑмÑе звÑковÑе Ð²Ð¾Ð»Ð½Ñ 102 и 103 оÑлиÑаÑÑÑÑ Ð´ÑÑг Ð¾Ñ Ð´ÑÑга вÑеменем поÑÑÑÐ¿Ð»ÐµÐ½Ð¸Ñ Ð¸ ÑÑовнем ÑнеÑгии. ÐаÑамеÑÑÑ CTD и CLD могÑÑ Ð±ÑÑÑ ÑÐ¾Ð·Ð´Ð°Ð½Ñ Ð½Ð° оÑнове ÑазноÑÑей вÑемен поÑÑÑÐ¿Ð»ÐµÐ½Ð¸Ñ Ð¸ ÑÑовней ÑнеÑгии звÑковÑÑ Ð²Ð¾Ð»Ð½ 102 и 103 ÑооÑвеÑÑÑвенно. Ðдобавок, в ÑÑи 106 и 107 поÑÑÑпаÑÑ Ð¾ÑÑаженнÑе звÑковÑе Ð²Ð¾Ð»Ð½Ñ 104 и 105 ÑооÑвеÑÑÑвенно, коÑоÑÑе не имеÑÑ Ð²Ð·Ð°Ð¸Ð¼Ð½Ð¾Ð¹ коÑÑелÑÑии. ÐаÑамеÑÑ ICC Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ñоздан на оÑнове коÑÑелÑÑии Ð¼ÐµÐ¶Ð´Ñ Ð·Ð²ÑковÑми волнами 104 и 105.The creation of CTD and CLD parameters is shown in FIG. 1. The first direct sound wave 103 from a distant sound source 101 enters the left human ear 107, and the second direct sound wave 102 diffracts around the personâs head, reaching his right ear 106. The direct sound waves 102 and 103 differ in arrival time and level energy. The CTD and CLD parameters can be created based on differences in the arrival times and energy levels of the sound waves 102 and 103, respectively. In addition, reflected sound waves 104 and 105, respectively, which do not have mutual correlation, enter the ears 106 and 107. The ICC parameter can be created based on the correlation between the sound waves 104 and 105.
РкодеÑе из многоканалÑного Ð²Ñ Ð¾Ð´Ð½Ð¾Ð³Ð¾ аÑдиоÑигнала вÑделÑеÑÑÑ Ð¿ÑоÑÑÑанÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ (напÑимеÑ, пÑоÑÑÑанÑÑвеннÑе паÑамеÑÑÑ), и ÑоздаеÑÑÑ Ñигнал, ÑвлÑÑÑийÑÑ ÑезÑлÑÑаÑом понижаÑÑего микÑиÑованиÑ. Сигнал поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ пÑоÑÑÑанÑÑвеннÑе паÑамеÑÑÑ Ð¿ÐµÑедаÑÑÑÑ Ð² декодеÑ. ÐÐ»Ñ Ñигнала поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¼Ð¾Ð¶Ð½Ð¾ иÑполÑзоваÑÑ Ð»Ñбое колиÑеÑÑво аÑдиоканалов, вклÑÑаÑ, но не ÑолÑко: моноÑигнал, ÑÑеÑеоÑигнал или многоканалÑнÑй аÑдиоÑигнал. РдекодеÑе из Ñигнала поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ пÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑов ÑоздаеÑÑÑ Ð¼Ð½Ð¾Ð³Ð¾ÐºÐ°Ð½Ð°Ð»ÑнÑй Ñигнал, ÑвлÑÑÑийÑÑ ÑезÑлÑÑаÑом повÑÑаÑÑего микÑиÑованиÑ.In the encoder, spatial information (for example, spatial parameters) is extracted from the multichannel input audio signal, and a signal resulting from the downmix is generated. The signal after down-mixing and spatial parameters are transmitted to the decoder. For the signal after down-mixing, you can use any number of audio channels, including, but not limited to: mono signal, stereo signal or multi-channel audio signal. In the decoder, a multi-channel signal is created from the signal after down-mixing and spatial parameters, which is the result of up-mixing.
Ðа Ñиг. 2 пÑедÑÑавлена блок-ÑÑ ÐµÐ¼Ð° кодеÑа Ð´Ð»Ñ ÐºÐ¾Ð´Ð¸ÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð°ÑдиоÑигнала ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. ÐÐ¾Ð´ÐµÑ Ð²ÐºÐ»ÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð±Ð»Ð¾Ðº 202 понижаÑÑего микÑиÑованиÑ, блок 203 ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑии, блок 207 кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ñигнала поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ блок 209 мÑлÑÑиплекÑиÑованиÑ. ÐÐ¾Ð·Ð¼Ð¾Ð¶Ð½Ñ Ð¸ дÑÑгие конÑигÑÑаÑии кодеÑа. ÐодеÑÑ Ð¼Ð¾Ð³ÑÑ Ð±ÑÑÑ ÑÐµÐ°Ð»Ð¸Ð·Ð¾Ð²Ð°Ð½Ñ Ð°Ð¿Ð¿Ð°ÑаÑнÑми ÑÑедÑÑвами, пÑогÑаммнÑми ÑÑедÑÑвами или в виде комбинаÑии аппаÑаÑнÑÑ Ð¸ пÑогÑаммнÑÑ ÑÑедÑÑв. ÐодеÑÑ Ð¼Ð¾Ð³ÑÑ Ð±ÑÑÑ ÑÐµÐ°Ð»Ð¸Ð·Ð¾Ð²Ð°Ð½Ñ Ð² инÑегÑалÑнÑÑ Ð¼Ð¸ÐºÑоÑÑ ÐµÐ¼Ð°Ñ , набоÑÐ°Ñ Ð¼Ð¸ÐºÑоÑÑ ÐµÐ¼, однокÑиÑÑалÑной ÑиÑÑеме (SoC), ÑиÑÑовÑÑ Ð¿ÑоÑеÑÑоÑÐ°Ñ Ñигналов, пÑоÑеÑÑоÑÐ°Ñ Ð¾Ð±Ñего назнаÑÐµÐ½Ð¸Ñ Ð¸ ÑазлиÑнÑÑ ÑиÑÑовÑÑ Ð¸ аналоговÑÑ ÑÑÑÑойÑÑÐ²Ð°Ñ .In FIG. 2 is a block diagram of an encoder for encoding an audio signal according to one embodiment of the present invention. The encoder includes a downmix unit 202, a spatial information creation unit 203, a signal encoding unit 207 after the downmix, and a multiplexing unit 209. Other encoder configurations are possible. Encoders can be implemented in hardware, software, or as a combination of hardware and software. Encoders can be implemented in integrated circuits, chipsets, single-chip system (SoC), digital signal processors, general-purpose processors, and various digital and analog devices.
Ðлок 202 понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑÐ¾Ð·Ð´Ð°ÐµÑ Ð¸Ð· многоканалÑного аÑдиоÑигнала 201 Ñигнал 204, ÑвлÑÑÑийÑÑ ÑезÑлÑÑаÑом понижаÑÑего микÑиÑованиÑ. Ðа Ñиг. 2 x1,...,xn ÑказÑваÑÑ Ð²Ñ Ð¾Ð´Ð½Ñе аÑдиоканалÑ. Ðак ÑпоминалоÑÑ Ð²ÑÑе, Ñигнал 204 поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¼Ð¾Ð¶ÐµÑ Ð¿ÑедÑÑавлÑÑÑ Ñобой моноÑигнал, ÑÑеÑеоÑигнал или многоканалÑнÑй аÑдиоÑигнал. Рпоказанном пÑимеÑе x'1,...,x'm ÑказÑваÑÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво каналов Ñигнала 204 поÑле понижаÑÑего микÑиÑованиÑ. РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ ÐºÐ¾Ð´ÐµÑ Ð²Ð¼ÐµÑÑо Ñигнала 204 понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¾Ð±ÑабаÑÑÐ²Ð°ÐµÑ Ñигнал 205 понижаÑÑего микÑиÑованиÑ, коÑоÑÑй подаеÑÑÑ Ð¸Ð·Ð²Ð½Ðµ (напÑимеÑ, понижаÑÑее микÑиÑование Ð´Ð»Ñ ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ Ñ ÑдожеÑÑвеннÑÑ ÑÑÑекÑов).The downmix unit 202 creates from the multi-channel audio signal 201 a signal 204 resulting from the downmix. In FIG. 2 x 1 , ..., x n indicate the input audio channels. As mentioned above, the downmix signal 204 may be a mono signal, a stereo signal, or a multi-channel audio signal. In the example shown, x ' 1 , ..., x' m indicate the number of channels of the signal 204 after down-mixing. In some embodiments, the encoder, instead of the downmix signal 204, processes the downmix signal 205, which is supplied externally (e.g., downmix to create artistic effects).
Ðлок 203 ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑии Ð¸Ð·Ð²Ð»ÐµÐºÐ°ÐµÑ Ð¿ÑоÑÑÑанÑÑвеннÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¸Ð· многоканалÑного аÑдиоÑигнала 201. Ð ÑÑом ÑлÑÑае ÑеÑмин «пÑоÑÑÑанÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð¸Ð½ÑоÑмаÑиÑ» обознаÑÐ°ÐµÑ Ð¸Ð½ÑоÑмаÑиÑ, оÑноÑÑÑÑÑÑÑ Ðº каналам аÑдиоÑигнала, иÑполÑзÑемÑм пÑи повÑÑаÑÑем микÑиÑовании Ñигнала 204 поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ñ Ð¿Ð¾Ð»ÑÑением многоканалÑного аÑдиоÑигнала в декодеÑе. Сигнал 204 понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑоздаеÑÑÑ Ð¿Ð¾ÑÑедÑÑвом понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¼Ð½Ð¾Ð³Ð¾ÐºÐ°Ð½Ð°Ð»Ñного аÑдиоÑигнала. ÐÑоÑÑÑанÑÑвеннÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ ÐºÐ¾Ð´Ð¸ÑÑÑÑ Ð´Ð»Ñ Ð¾Ð±ÐµÑпеÑÐµÐ½Ð¸Ñ ÐºÐ¾Ð´Ð¸Ñованного Ñигнала 206 Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией.The spatial information creating unit 203 extracts spatial information from the multi-channel audio signal 201. In this case, the term âspatial informationâ refers to information related to the audio channels used in up-mixing of the signal 204 after down-mixing to obtain multi-channel audio in the decoder. The downmix signal 204 is created by downmixing a multi-channel audio signal. Spatial information is encoded to provide an encoded signal 206 with spatial information.
Ðлок 207 кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ñигнала понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑÐ¾Ð·Ð´Ð°ÐµÑ ÐºÐ¾Ð´Ð¸ÑованнÑй Ñигнал 208 понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿ÑÑем кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ñигнала 204 понижаÑÑего микÑиÑованиÑ, Ñозданного в блоке 202 понижаÑÑего микÑиÑованиÑ.The downmix signal encoding unit 207 creates an encoded downmix signal 208 by encoding the downmix signal 204 created in the downmix unit 202.
Ðлок 209 мÑлÑÑиплекÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑÐ¾Ð·Ð´Ð°ÐµÑ Ð±Ð¸ÑовÑй поÑок 210, вклÑÑаÑÑий в ÑÐµÐ±Ñ ÐºÐ¾Ð´Ð¸ÑованнÑй Ñигнал 208 поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ кодиÑованнÑй Ñигнал 206 Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией. ÐиÑовÑй поÑок 210 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÐµÑедан в поÑледÑÑÑий Ð´ÐµÐºÐ¾Ð´ÐµÑ Ð¸/или запиÑан на ноÑиÑеле даннÑÑ .The multiplexing unit 209 creates a bitstream 210 including an encoded signal 208 after down-mixing and an encoded signal 206 with spatial information. Bitstream 210 may be transmitted to a subsequent decoder and / or recorded on a storage medium.
Ðа Ñиг. 3 пÑедÑÑавлена блок-ÑÑ ÐµÐ¼Ð° декодеÑа Ð´Ð»Ñ Ð´ÐµÐºÐ¾Ð´Ð¸ÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ¾Ð´Ð¸Ñованного аÑдиоÑигнала ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. ÐÐµÐºÐ¾Ð´ÐµÑ Ð²ÐºÐ»ÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð±Ð»Ð¾Ðº 302 демÑлÑÑиплекÑиÑованиÑ, блок 305 декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ñигнала поÑле понижаÑÑего микÑиÑованиÑ, блок 307 декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑии и блок 309 повÑÑаÑÑего микÑиÑованиÑ. ÐекодеÑÑ Ð¼Ð¾Ð³ÑÑ Ð±ÑÑÑ ÑÐµÐ°Ð»Ð¸Ð·Ð¾Ð²Ð°Ð½Ñ Ð°Ð¿Ð¿Ð°ÑаÑнÑми ÑÑедÑÑвами, пÑогÑаммнÑми ÑÑедÑÑвами или в виде комбинаÑии аппаÑаÑнÑÑ Ð¸ пÑогÑаммнÑÑ ÑÑедÑÑв. ÐекодеÑÑ Ð¼Ð¾Ð³ÑÑ Ð±ÑÑÑ ÑÐµÐ°Ð»Ð¸Ð·Ð¾Ð²Ð°Ð½Ñ Ð² инÑегÑалÑнÑÑ Ð¼Ð¸ÐºÑоÑÑ ÐµÐ¼Ð°Ñ , набоÑÐ°Ñ Ð¼Ð¸ÐºÑоÑÑ ÐµÐ¼, однокÑиÑÑалÑной ÑиÑÑеме (SoC), ÑиÑÑовÑÑ Ð¿ÑоÑеÑÑоÑÐ°Ñ Ñигналов, пÑоÑеÑÑоÑÐ°Ñ Ð¾Ð±Ñего назнаÑÐµÐ½Ð¸Ñ Ð¸ ÑазлиÑнÑÑ ÑиÑÑовÑÑ Ð¸ аналоговÑÑ ÑÑÑÑойÑÑÐ²Ð°Ñ .In FIG. 3 is a block diagram of a decoder for decoding an encoded audio signal according to one embodiment of the present invention. The decoder includes a demultiplexing unit 302, a downmix signal decoding unit 305, a spatial information decoding unit 307, and an upmix unit 309. Decoders can be implemented in hardware, software, or as a combination of hardware and software. Decoders can be implemented in integrated circuits, chipsets, single-chip system (SoC), digital signal processors, general-purpose processors, and various digital and analog devices.
РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð±Ð»Ð¾Ðº 302 демÑлÑÑиплекÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿ÑÐ¸Ð½Ð¸Ð¼Ð°ÐµÑ Ð±Ð¸ÑовÑй поÑок 301, пÑедÑÑавлÑÑÑий аÑдиоÑигнал, а заÑем вÑделÑÐµÑ Ð¸Ð· биÑового поÑока 301 кодиÑованнÑй Ñигнал 303 поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ кодиÑованнÑй Ñигнал 304 Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией. Ðа Ñиг. 3 x'1,...,x'm ÑказÑваÑÑ ÐºÐ°Ð½Ð°Ð»Ñ Ñигнала 303 поÑле понижаÑÑего микÑиÑованиÑ. Ðлок 305 декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ñигнала понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð²ÑÐ²Ð¾Ð´Ð¸Ñ Ð´ÐµÐºÐ¾Ð´Ð¸ÑованнÑй Ñигнал 306 понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿Ð¾ÑÑедÑÑвом декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ¾Ð´Ð¸Ñованного Ñигнала 303 понижаÑÑего микÑиÑованиÑ. ÐÑли Ð´ÐµÐºÐ¾Ð´ÐµÑ Ð½Ðµ ÑпоÑобен вÑдаваÑÑ Ð¼Ð½Ð¾Ð³Ð¾ÐºÐ°Ð½Ð°Ð»ÑнÑй аÑдиоÑигнал, Ñо Ñогда блок 305 декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ñигнала понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¼Ð¾Ð¶ÐµÑ Ð½ÐµÐ¿Ð¾ÑÑедÑÑвенно вÑвеÑÑи Ñигнал 306 понижаÑÑего микÑиÑованиÑ. Ðа Ñиг. 3 y'1,...,y'm ÑказÑваÑÑ Ð¿ÑÑмÑе вÑÑ Ð¾Ð´Ð½Ñе ÐºÐ°Ð½Ð°Ð»Ñ Ð±Ð»Ð¾ÐºÐ° 305 декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ñигнала понижаÑÑего микÑиÑованиÑ.In some embodiments, the demultiplexing unit 302 receives a bitstream 301 representing an audio signal, and then extracts the encoded signal 303 from the bitstream 301 after down-mixing and the encoded signal 304 with spatial information. In FIG. 3 x ' 1 , ..., x' m indicate the channels of signal 303 after down-mixing. The downmix signal decoding unit 305 outputs the decoded downmix signal 306 by decoding the encoded downmix signal 303. If the decoder is not capable of delivering a multi-channel audio signal, then the downmix signal decoding unit 305 can directly output the downmix signal 306. In FIG. 3 y ' 1 , ..., y' m indicate the direct output channels of the downmix signal decoding unit 305.
Ðлок 307 декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ñигнала Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией вÑделÑÐµÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ конÑигÑÑаÑии Ñигнала Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией из закодиÑованного Ñигнала 304 Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией, а заÑем декодиÑÑÐµÑ Ñигнал 304 Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией, иÑполÑзÑÑ Ð¸Ð·Ð²Ð»ÐµÑеннÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ конÑигÑÑаÑии.The spatial information signal decoding unit 307 extracts the spatial information signal configuration information from the encoded spatial information signal 304, and then decodes the spatial information signal 304 using the extracted configuration information.
Ðлок 309 повÑÑаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¼Ð¾Ð¶ÐµÑ Ð²ÑполниÑÑ Ð¿Ð¾Ð²ÑÑаÑÑее микÑиÑование Ñигнала 306, ÑвлÑÑÑегоÑÑ ÑезÑлÑÑаÑом понижаÑÑего микÑиÑованиÑ, Ñ Ð¿Ð¾Ð»ÑÑением многоканалÑного аÑдиоÑигнала 310, иÑполÑзÑÑ Ð¸Ð·Ð²Ð»ÐµÑеннÑÑ Ð¿ÑоÑÑÑанÑÑвеннÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ 308. Ðа Ñиг. 3 y1,...,yn ÑказÑваÑÑ ÑÑд вÑÑ Ð¾Ð´Ð½ÑÑ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² блока 309 повÑÑаÑÑего микÑиÑованиÑ.The upmixing unit 309 may up-mix the signal 306 resulting from the downmix to obtain a multi-channel audio signal 310 using the extracted spatial information 308. FIG. 3 y 1 , ..., y n indicate a series of output channels of upmix unit 309.
Ðа Ñиг. 4 пÑедÑÑавлена блок-ÑÑ ÐµÐ¼Ð° модÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð², коÑоÑÑй Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²ÐºÐ»ÑÑен в ÑоÑÑав блока 309 повÑÑаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð² декодеÑе, показанном на Ñиг. 3. РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð±Ð»Ð¾Ðº 309 повÑÑаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð¼Ð½Ð¾Ð¶ÐµÑÑво модÑлей пÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð². ÐодÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² ÑвлÑеÑÑÑ ÐºÐ¾Ð½ÑепÑÑалÑнÑм ÑÑÑÑойÑÑвом, коÑоÑое Ð¼Ð¾Ð¶ÐµÑ Ð¾ÑлиÑаÑÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво Ð²Ñ Ð¾Ð´Ð½ÑÑ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² Ð¾Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва вÑÑ Ð¾Ð´Ð½ÑÑ ÐºÐ°Ð½Ð°Ð»Ð¾Ð², иÑполÑзÑÑ ÑпеÑиалÑнÑÑ Ð¸Ð½ÑоÑмаÑиÑ.In FIG. 4 is a block diagram of a channel conversion module that may be included in upmix unit 309 in the decoder shown in FIG. 3. In some embodiments, upmix unit 309 may include multiple channel conversion modules. The channel conversion module is a conceptual device that can distinguish the number of input channels from the number of output channels using special information.
РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð¼Ð¾Ð´ÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð±Ð»Ð¾Ðº OTT (один к двÑм) Ð´Ð»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ Ð¾Ð´Ð½Ð¾Ð³Ð¾ канала в два канала и наобоÑÐ¾Ñ Ð¸ блок TTT (два к ÑÑем) Ð´Ð»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ Ð´Ð²ÑÑ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² в ÑÑи канала и наобоÑоÑ. Ðлоки OTT и/или TTT могÑÑ Ð±ÑÑÑ ÑÐºÐ¾Ð¼Ð¿Ð¾Ð½Ð¾Ð²Ð°Ð½Ñ Ñ Ð¸ÑполÑзованием множеÑÑва ÑазлиÑнÑÑ Ð¿Ð¾Ð»ÐµÐ·Ð½ÑÑ ÐºÐ¾Ð½ÑигÑÑаÑий. ÐапÑимеÑ, блок 309 повÑÑаÑÑего микÑиÑованиÑ, показаннÑй на Ñиг. 3, Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ ÐºÐ¾Ð½ÑигÑÑаÑÐ¸Ñ 5-1-5, конÑигÑÑаÑÐ¸Ñ 5-2-5, конÑигÑÑаÑÐ¸Ñ 7-2-7, конÑигÑÑаÑÐ¸Ñ 7-5-7 и Ñ.д. РконÑигÑÑаÑии 5-1-5 Ñигнал, имеÑÑий поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¾Ð´Ð¸Ð½ канал, ÑоздаеÑÑÑ Ð¿ÑÑем понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿ÑÑи каналов в один канал, коÑоÑÑй заÑем Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿Ð¾Ð´Ð²ÐµÑгнÑÑ Ð¿Ð¾Ð²ÑÑаÑÑÐµÐ¼Ñ Ð¼Ð¸ÐºÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð´Ð¾ пÑÑи каналов. ÐналогиÑнÑм обÑазом можно ÑоздаÑÑ Ð¸ дÑÑгие конÑигÑÑаÑии, иÑполÑзÑÑ ÑазлиÑнÑе комбинаÑии блоков OTT и TTT.In some embodiments, the channel conversion module may include an OTT block (one to two) for converting one channel to two channels and vice versa and a TTT block (two to three) for converting two channels to three channels and vice versa. OTT and / or TTT blocks can be arranged using many different useful configurations. For example, the upmix unit 309 shown in FIG. 3 may include configuration 5-1-5, configuration 5-2-5, configuration 7-2-7, configuration 7-5-7, etc. In configuration 5-1-5, a signal having one channel after downmixing is created by downmixing five channels into one channel, which can then be upmixed to five channels. Similarly, other configurations can be created using various combinations of OTT and TTT blocks.
ÐбÑаÑимÑÑ Ðº Ñиг. 4, где показана в каÑеÑÑве пÑимеÑа конÑигÑÑаÑÐ¸Ñ 5-2-5 Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° 400 повÑÑаÑÑего микÑиÑованиÑ. РконÑигÑÑаÑии 5-2-5 Ñигнал 401, коÑоÑÑй поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸Ð¼ÐµÐµÑ Ð´Ð²Ð° канала, вводиÑÑÑ Ð² блок 400 повÑÑаÑÑего микÑиÑованиÑ. Рпоказанном пÑимеÑе в каÑеÑÑве Ð²Ñ Ð¾Ð´Ð¾Ð² в блок 400 повÑÑаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿ÑедÑÑмоÑÑÐµÐ½Ñ Ð»ÐµÐ²Ñй канал (L) и пÑавÑй канал (R). Ð ÑÑом ваÑианÑе блок 400 повÑÑаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð²ÐºÐ»ÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¾Ð´Ð¸Ð½ блок TTT 402 и ÑÑи блока OTT 406, 407 и 408. Сигнал 401, коÑоÑÑй Ð¸Ð¼ÐµÐµÑ Ð¿Ð¾Ñле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð´Ð²Ð° канала, подаеÑÑÑ Ð² каÑеÑÑве Ð²Ñ Ð¾Ð´Ð½Ð¾Ð³Ð¾ Ñигнал в блок TTT (TTTo) 402, коÑоÑÑй обÑабаÑÑÐ²Ð°ÐµÑ Ñигнал 401 поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ обеÑпеÑÐ¸Ð²Ð°ÐµÑ Ð² каÑеÑÑве вÑÑ Ð¾Ð´Ð½ÑÑ Ñигналов ÑÑи канала 403, 404 и 405. РкаÑеÑÑве Ð²Ñ Ð¾Ð´Ð° в блок TTT 402 могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑмоÑÑÐµÐ½Ñ Ð¾Ð´Ð¸Ð½ или неÑколÑко пÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑов (напÑимеÑ, CPC, CLD, ICC), коÑоÑÑе иÑполÑзÑÑÑ Ð´Ð»Ñ Ð¾Ð±ÑабоÑки Ñигнала 401 поÑле понижаÑÑего микÑиÑованиÑ, как опиÑано ниже. РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð² каÑеÑÑве Ð²Ñ Ð¾Ð´Ð° в блок TTT 402 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¸Ð·Ð±Ð¸ÑаÑелÑно пÑедÑÑмоÑÑен оÑÑаÑоÑнÑй Ñигнал. Ð Ñказанном ÑлÑÑае в каÑеÑÑве коÑÑÑиÑиенÑа пÑедÑÐºÐ°Ð·Ð°Ð½Ð¸Ñ Ð´Ð»Ñ ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ ÑÑÐµÑ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² из дÑÑ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¾Ð¿Ñеделен паÑамеÑÑ CPC.Turning to FIG. 4, which shows, by way of example, the configuration 5-2-5 for the upmix unit 400. In the configuration 5-2-5, the signal 401, which after downmixing has two channels, is input to the upmixing unit 400. In the example shown, the left channel (L) and the right channel (R) are provided as inputs to the upmix unit 400. In this embodiment, the upmix block 400 includes one TTT block 402 and three OTT blocks 406, 407 and 408. A signal 401, which has two channels after downmix, is supplied as input to the TTT block (TTTo) 402, which processes signal 401 after down-mixing and provides three channels 403, 404 and 405 as output signals. One or more spatial parameters (for example, CPC, CLD, ICC) that are used to process signal 401 can be provided as input to the TTT block 402 after down mix i as described below. In some embodiments, a residual signal may be selectively provided as input to the TTT 402. In this case, the CPC parameter can be determined as the prediction coefficient for creating three channels from the spirit of the channels.
Ðанал 403, коÑоÑÑй пÑедÑÑмоÑÑен в каÑеÑÑве вÑÑ Ð¾Ð´Ð° из блока TTT 402, ÑвлÑеÑÑÑ Ð²Ñ Ð¾Ð´Ð¾Ð¼ в блок OTT 406, коÑоÑÑй ÑÐ¾Ð·Ð´Ð°ÐµÑ Ð´Ð²Ð° вÑÑ Ð¾Ð´Ð½ÑÑ ÐºÐ°Ð½Ð°Ð»Ð°, иÑполÑзÑÑ Ð¾Ð´Ð¸Ð½ или неÑколÑко пÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑов. Рпоказанном пÑимеÑе два вÑÑ Ð¾Ð´Ð½ÑÑ ÐºÐ°Ð½Ð°Ð»Ð° пÑедÑÑавлÑÑÑ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð¿ÐµÑеднего левого (FL) и заднего левого (BL) динамиков, напÑимеÑ, в обÑемной звÑковой ÑÑеде. Ðанал 404 пÑедÑÑмоÑÑен в каÑеÑÑве Ð²Ñ Ð¾Ð´Ð° в блок OTT 407, коÑоÑÑй ÑÐ¾Ð·Ð´Ð°ÐµÑ Ð´Ð²Ð° вÑÑ Ð¾Ð´Ð½ÑÑ ÐºÐ°Ð½Ð°Ð»Ð°, иÑполÑзÑÑ Ð¾Ð´Ð¸Ð½ или неÑколÑко пÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑов. Рпоказанном пÑимеÑе два вÑÑ Ð¾Ð´Ð½ÑÑ ÐºÐ°Ð½Ð°Ð»Ð° пÑедÑÑавлÑÑÑ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð¿ÐµÑеднего пÑавого (FR) и заднего пÑавого (BR) динамиков. Ðанал 405 пÑедÑÑмоÑÑен в каÑеÑÑве Ð²Ñ Ð¾Ð´Ð° в блок OTT 408, коÑоÑÑй ÑÐ¾Ð·Ð´Ð°ÐµÑ Ð´Ð²Ð° вÑÑ Ð¾Ð´Ð½ÑÑ ÐºÐ°Ð½Ð°Ð»Ð°. Рпоказанном пÑимеÑе два вÑÑ Ð¾Ð´Ð½ÑÑ ÐºÐ°Ð½Ð°Ð»Ð° пÑедÑÑавлÑÑÑ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ðµ ÑенÑÑалÑного (С) динамика и канал низкоÑаÑÑоÑной опÑимизаÑии (LFE). Ð ÑÑом ÑлÑÑае пÑоÑÑÑанÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ (напÑимеÑ, CLD, ICC) Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑмоÑÑена в каÑеÑÑве Ð²Ñ Ð¾Ð´Ð° Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ из блоков OTT. РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð² каÑеÑÑве Ð²Ñ Ð¾Ð´Ð¾Ð² в блоки OTT 406 и 407 могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑмоÑÑÐµÐ½Ñ Ð¾ÑÑаÑоÑнÑе ÑÐ¸Ð³Ð½Ð°Ð»Ñ (Res1, Res2). Ð Ñказанном ваÑианÑе оÑÑаÑоÑнÑй Ñигнал Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð½Ðµ пÑедÑÑмоÑÑен в каÑеÑÑве Ð²Ñ Ð¾Ð´Ð½Ð¾Ð³Ð¾ Ñигнала в блок OTT 408, коÑоÑÑй вÑÐ´Ð°ÐµÑ ÑенÑÑалÑнÑй канал и канал LFE. Channel 403, which is provided as an output from the TTT block 402, is an input to the OTT block 406, which creates two output channels using one or more spatial parameters. In the example shown, the two output channels represent the positions of the front left (FL) and rear left (BL) speakers, for example, in a surround sound environment. Channel 404 is provided as an input to the OTT block 407, which creates two output channels using one or more spatial parameters. In the example shown, the two output channels represent the positions of the front right (FR) and rear right (BR) speakers. Channel 405 is provided as an input to the OTT block 408, which creates two output channels. In the example shown, two output channels represent the position of the center (C) speaker and the low-frequency optimization (LFE) channel. In this case, spatial information (e.g., CLD, ICC) may be provided as an input for each of the OTT blocks. In some embodiments, residual signals (Res1, Res2) may be provided as inputs to the OTT blocks 406 and 407. In the indicated embodiment, the residual signal may not be provided as an input signal to the OTT 408 block, which provides the central channel and the LFE channel.
ÐонÑигÑÑаÑиÑ, Ð¿Ð¾ÐºÐ°Ð·Ð°Ð½Ð½Ð°Ñ Ð½Ð° Ñиг. 4, ÑвлÑеÑÑÑ Ð¾Ð´Ð½Ð¸Ð¼ пÑимеÑом конÑигÑÑаÑии Ð´Ð»Ñ Ð¼Ð¾Ð´ÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð². ÐÐ¾Ð·Ð¼Ð¾Ð¶Ð½Ñ Ð´ÑÑгие конÑигÑÑаÑии Ð´Ð»Ñ Ð¼Ð¾Ð´ÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð², вклÑÑаÑÑие в ÑÐµÐ±Ñ ÑазлиÑнÑе комбинаÑии блоков OTT и TTT. ÐоÑколÑÐºÑ ÐºÐ°Ð¶Ð´Ñй из модÑлей пÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² Ð¼Ð¾Ð¶ÐµÑ ÑÑнкÑиониÑоваÑÑ Ð² ÑаÑÑоÑной облаÑÑи, можно опÑеделиÑÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименимÑÑ Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ из модÑлей пÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð². Ðиапазон паÑамеÑÑа ознаÑÐ°ÐµÑ Ð¿Ð¾ менÑÑей меÑе один ÑаÑÑоÑнÑй диапазон, пÑименимÑй к Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð¿Ð°ÑамеÑÑÑ. Ð Ñд паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² опиÑан Ñо ÑÑÑлками на Ñиг. 6Ð.The configuration shown in FIG. 4 is one example configuration for a channel conversion module. Other configurations for the channel conversion module are possible, including various combinations of OTT and TTT blocks. Since each of the channel conversion modules can operate in the frequency domain, it is possible to determine the number of parametric ranges applicable to each of the channel conversion modules. A parameter range means at least one frequency range applicable to one parameter. A number of parametric ranges are described with reference to FIG. 6B.
Ðа Ñиг. 5 показана ÑÑ ÐµÐ¼Ð°, иллÑÑÑÑиÑÑÑÑÐ°Ñ ÑпоÑоб конÑигÑÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð±Ð¸Ñового поÑока аÑдиоÑигнала ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. Ðа Ñиг. 5(а) показан биÑовÑй поÑок аÑдиоÑигнала, вклÑÑаÑÑего ÑолÑко Ñигнал Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией, а на ÑигÑÑÐ°Ñ 5(b) и 5(Ñ) Ð¿Ð¾ÐºÐ°Ð·Ð°Ð½Ñ Ð±Ð¸ÑовÑе поÑоки аÑдиоÑигнала, вклÑÑаÑÑего в ÑÐµÐ±Ñ Ñигнал поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ Ñигнал Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией.In FIG. 5 is a diagram illustrating a method for configuring an audio bitstream according to one embodiment of the present invention. In FIG. 5 (a) shows a bit stream of an audio signal including only a spatial information signal, and FIGS. 5 (b) and 5 (c) show bit streams of an audio signal including a downmix signal and a spatial information signal.
ÐбÑаÑимÑÑ Ðº Ñиг. 5(а), где биÑовÑй поÑок аÑдиоÑигнала Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ 501 о конÑигÑÑаÑии и ÐºÐ°Ð´Ñ 503. ÐÐ°Ð´Ñ 503 Ð¼Ð¾Ð¶ÐµÑ Ð¿Ð¾Ð²ÑоÑÑÑÑÑÑ Ð² биÑовом поÑоке, пÑиÑем в некоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ ÐµÐ´Ð¸Ð½ÑÑвеннÑй пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ 502, ÑодеÑжаÑий пÑоÑÑÑанÑÑвеннÑÑ Ð°ÑдиоинÑоÑмаÑиÑ.Turning to FIG. 5 (a), where the bitstream of the audio signal may include configuration information 501 and frame 503. Frame 503 may be repeated in the bitstream, and in some embodiments, include a single spatial frame 502 containing spatial audio information.
РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ 501 о конÑигÑÑаÑии вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¸Ð½ÑоÑмаÑиÑ, опиÑÑваÑÑÑÑ Ð¾Ð±Ñее колиÑеÑÑво вÑеменнÑÑ Ð¸Ð½ÑеÑвалов в одном пÑоÑÑÑанÑÑвенном кадÑе 502, обÑее колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², Ð¾Ñ Ð²Ð°ÑÑваÑÑÐ¸Ñ ÑаÑÑоÑнÑй диапазон аÑдиоÑигнала, колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² в блоке OTT, колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² в блоке TTT и колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² в оÑÑаÑоÑном Ñигнале. ÐÑи Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾ÑÑи в инÑоÑмаÑÐ¸Ñ 501 о конÑигÑÑаÑии Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²ÐºÐ»ÑÑена и дÑÑÐ³Ð°Ñ Ð¸Ð½ÑоÑмаÑиÑ.In some embodiments, configuration information 501 includes information describing the total number of time slots in one spatial frame 502, the total number of parametric ranges spanning the audio frequency range, the number of parametric ranges in the OTT block, the number of parametric ranges in the TTT block, and the number of parametric ranges in the residual signal. If necessary, other information may be included in the configuration information 501.
РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð¿ÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ 502 вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¾Ð´Ð¸Ð½ или неÑколÑко пÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑов (напÑимеÑ, CLD, ICC), Ñип кадÑа, колиÑеÑÑво набоÑов паÑамеÑÑов в одном кадÑе, а Ñакже вÑеменнÑе инÑеÑвалÑ, Ð´Ð»Ñ ÐºÐ¾ÑоÑÑÑ Ð¼Ð¾Ð³ÑÑ Ð±ÑÑÑ Ð¿ÑÐ¸Ð¼ÐµÐ½ÐµÐ½Ñ Ð½Ð°Ð±Ð¾ÑÑ Ð¿Ð°ÑамеÑÑов. ÐÑи Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾ÑÑи в пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ 502 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²ÐºÐ»ÑÑена и дÑÑÐ³Ð°Ñ Ð¸Ð½ÑоÑмаÑиÑ. СмÑÑл и ÑенноÑÑÑ Ð¸Ð½ÑоÑмаÑии 501 о конÑигÑÑаÑии и инÑоÑмаÑии, ÑодеÑжаÑейÑÑ Ð² пÑоÑÑÑанÑÑвенном кадÑе 502, обÑÑÑнÑÑÑÑÑ Ð½Ð¸Ð¶Ðµ Ñо ÑÑÑлками на ÑигÑÑÑ Ñ 6 по 10.In some embodiments, the spatial frame 502 includes one or more spatial parameters (eg, CLD, ICC), the type of frame, the number of parameter sets in one frame, as well as time intervals for which parameter sets can be applied. Optionally, other information may be included in the spatial frame 502. The meaning and value of the configuration information 501 and the information contained in the spatial frame 502 are explained below with reference to figures 6 through 10.
ÐбÑаÑимÑÑ Ðº Ñиг. 5(b), где биÑовÑй поÑок аÑдиоÑигнала Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ 504 о конÑигÑÑаÑии, Ñигнал 505 поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ 506. Ð ÑÑом ÑлÑÑае один ÐºÐ°Ð´Ñ 507 Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ñигнал 505 поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ 506, пÑиÑем ÐºÐ°Ð´Ñ 507 Ð¼Ð¾Ð¶ÐµÑ Ð² биÑовом поÑоке повÑоÑÑÑÑÑÑ.Turning to FIG. 5 (b), where the bitstream of the audio signal may include configuration information 504, the downmix signal 505 and the spatial frame 506. In this case, one frame 507 may include the downmix signal 505 and the spatial frame 506, the frame 507 may be repeated in the bitstream.
ÐбÑаÑимÑÑ Ðº Ñиг. 5(Ñ), где биÑовÑй поÑок аÑдиоÑигнала Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ñигнал 508 поÑле понижаÑÑего микÑиÑованиÑ, инÑоÑмаÑÐ¸Ñ 509 о конÑигÑÑаÑии и пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ 510. Ð ÑÑом ÑлÑÑае один ÐºÐ°Ð´Ñ 511 Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ 509 о конÑигÑÑаÑии и пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ 510, пÑиÑем ÐºÐ°Ð´Ñ 511 в биÑовом поÑоке Ð¼Ð¾Ð¶ÐµÑ Ð¿Ð¾Ð²ÑоÑÑÑÑÑÑ. ÐÑли инÑоÑмаÑÐ¸Ñ 509 о конÑигÑÑаÑии вÑÑавлена в каждÑй ÐºÐ°Ð´Ñ 511, Ñо аÑдиоÑигнал Ð¼Ð¾Ð¶ÐµÑ Ð²Ð¾ÑпÑоизводиÑÑÑÑ ÑÑÑÑойÑÑвом воÑпÑÐ¾Ð¸Ð·Ð²ÐµÐ´ÐµÐ½Ð¸Ñ Ñ Ð¿ÑоизволÑного меÑÑа.Turning to FIG. 5 (c), where the bitstream of the audio signal may include the downmix signal 508, configuration information 509 and spatial frame 510. In this case, one frame 511 may include configuration information 509 and spatial frame 510, wherein frame 511 in the bitstream can be repeated. If configuration information 509 is inserted in each frame 511, then the audio signal may be reproduced by the reproducing apparatus from an arbitrary location.
ХоÑÑ Ð½Ð° Ñиг. 5(Ñ) показано, ÑÑо инÑоÑмаÑÐ¸Ñ 509 о конÑигÑÑаÑии вÑÑавлена в биÑовÑй поÑок Ñ Ð¿Ð¾Ð¼Ð¾ÑÑÑ ÐºÐ°Ð´Ñа 511, должно бÑÑÑ Ð¾Ñевидно, ÑÑо инÑоÑмаÑÐ¸Ñ 509 о конÑигÑÑаÑии Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²ÑÑавлена в биÑовÑй поÑок Ñ Ð¸ÑполÑзованием множеÑÑва кадÑов, коÑоÑÑе повÑоÑÑÑÑÑÑ Ð¿ÐµÑиодиÑеÑки или непеÑиодиÑеÑки.Although in FIG. 5 (c) shows that configuration information 509 is inserted into the bitstream using frame 511, it should be apparent that configuration information 509 can be inserted into the bitstream using multiple frames that are repeated periodically or non-periodically.
Ðа ÑигÑÑÐ°Ñ 6Ри 6РпÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ ÑÑ ÐµÐ¼Ñ, иллÑÑÑÑиÑÑÑÑие ÑвÑзи Ð¼ÐµÐ¶Ð´Ñ Ð½Ð°Ð±Ð¾Ñом паÑамеÑÑов, вÑеменнÑм инÑеÑвалом и паÑамеÑÑиÑеÑкими диапазонами ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. ÐÐ°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов обознаÑÐ°ÐµÑ Ð¾Ð´Ð¸Ð½ или неÑколÑко пÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑов, иÑполÑзÑемÑÑ Ð´Ð»Ñ Ð¾Ð´Ð½Ð¾Ð³Ð¾ вÑеменного инÑеÑвала. ÐÑоÑÑÑанÑÑвеннÑе паÑамеÑÑÑ Ð¼Ð¾Ð³ÑÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð¿ÑоÑÑÑанÑÑвеннÑÑ Ð¸Ð½ÑоÑмаÑиÑ, ÑакÑÑ ÐºÐ°Ðº CDL, ICC, CPC и Ñ.д. ÐÑеменной инÑеÑвал ознаÑÐ°ÐµÑ Ð¸Ð½ÑеÑвал аÑдиоÑигнала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого могÑÑ Ð±ÑÑÑ Ð¿ÑÐ¸Ð¼ÐµÐ½ÐµÐ½Ñ Ð¿ÑоÑÑÑанÑÑвеннÑе паÑамеÑÑÑ. Ðдин пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð¾Ð´Ð¸Ð½ или неÑколÑко вÑеменнÑÑ Ð¸Ð½ÑеÑвалов.Figures 6A and 6B are diagrams illustrating the relationships between a set of parameters, a time interval, and parametric ranges according to one embodiment of the present invention. A set of parameters indicates one or more spatial parameters used for a single time interval. Spatial parameters may include spatial information such as CDL, ICC, CPC, etc. A time interval means an interval of an audio signal for which spatial parameters can be applied. One spatial frame may include one or more time slots.
ÐбÑаÑимÑÑ Ðº Ñиг. 6Ð, где в пÑоÑÑÑанÑÑвенном кадÑе Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¸ÑполÑзовано неÑколÑко набоÑов паÑамеÑÑов 1,â¦,P, а каждÑй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð¾Ð´Ð½Ð¾ или неÑколÑко полей 1,â¦,Q-1 даннÑÑ . ÐÐ°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿Ñименен ко вÑÐµÐ¼Ñ ÑаÑÑоÑÐ½Ð¾Ð¼Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ñ Ð°ÑдиоÑигнала, а каждÑй пÑоÑÑÑанÑÑвеннÑй паÑамеÑÑ Ð² набоÑе паÑамеÑÑов Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿Ñименен к Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð¸Ð»Ð¸ неÑколÑким ÑÑаÑÑкам полоÑÑ ÑаÑÑоÑ. ÐапÑимеÑ, еÑли Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ 20 пÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑов, Ñо вÑÑ Ð¿Ð¾Ð»Ð¾Ñа ÑаÑÑÐ¾Ñ Ð°ÑдиоÑигнала Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ ÑазбиÑа на 20 зон (назÑваемÑÑ Ð´Ð°Ð»ÐµÐµ «паÑамеÑÑиÑеÑкие диапазонÑ»), и Ð´Ð»Ñ 20 паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² можно пÑимениÑÑ 20 пÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑов из данного набоÑа паÑамеÑÑов. ÐаÑамеÑÑÑ Ð¼Ð¾Ð³ÑÑ Ð±ÑÑÑ Ð¿ÑÐ¸Ð¼ÐµÐ½ÐµÐ½Ñ Ðº паÑамеÑÑиÑеÑким диапазонам иÑÑ Ð¾Ð´Ñ Ð¸Ð· конкÑеÑнÑÑ ÑÑебований. ÐапÑимеÑ, пÑоÑÑÑанÑÑвеннÑе паÑамеÑÑÑ Ð¼Ð¾Ð³ÑÑ Ð±ÑÑÑ Ð¿ÑÐ¸Ð¼ÐµÐ½ÐµÐ½Ñ Ðº низкоÑаÑÑоÑнÑм паÑамеÑÑиÑеÑким диапазонам без ÑазÑÑдки, а к вÑÑокоÑаÑÑоÑнÑм паÑамеÑÑиÑеÑким диапазонам Ñ ÑазÑÑдкой.Turning to FIG. 6A, where in a spatial frame several sets of parameters 1, ..., P can be used, and each set of parameters can include one or more data fields 1, ..., Q-1. The set of parameters can be applied to the entire frequency range of the audio signal, and each spatial parameter in the set of parameters can be applied to one or more parts of the frequency band. For example, if a set of parameters includes 20 spatial parameters, then the entire frequency band of the audio signal can be divided into 20 zones (hereinafter referred to as âparametric rangesâ), and for 20 parametric ranges you can apply 20 spatial parameters from this set of parameters. Parameters can be applied to parametric ranges based on specific requirements. For example, spatial parameters can be applied to low-frequency parametric ranges without discharge, and to high-frequency parametric ranges with discharge.
ÐбÑаÑимÑÑ Ðº Ñиг. 6Ð, где гÑаÑик вÑемÑ/ÑаÑÑоÑа показÑÐ²Ð°ÐµÑ Ð²Ð·Ð°Ð¸Ð¼Ð¾ÑвÑÐ·Ñ Ð¼ÐµÐ¶Ð´Ñ Ð½Ð°Ð±Ð¾Ñами паÑамеÑÑов и вÑеменнÑми инÑеÑвалами. Рпоказанном пÑимеÑе ÑÑи набоÑа паÑамеÑÑов (Ð½Ð°Ð±Ð¾Ñ 1 паÑамеÑÑов, Ð½Ð°Ð±Ð¾Ñ 2 паÑамеÑÑов, Ð½Ð°Ð±Ð¾Ñ 3 паÑамеÑÑов) пÑименÑÑÑÑÑ Ð´Ð»Ñ ÑпоÑÑдоÑенного набоÑа из 12 вÑеменнÑÑ Ð¸Ð½ÑеÑвалов в одном пÑоÑÑÑанÑÑвенном кадÑе. Ð ÑÑом ÑлÑÑае веÑÑ ÑаÑÑоÑнÑй диапазон аÑдиоÑигнала ÑазбиваеÑÑÑ Ð½Ð° 9 паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð². Таким обÑазом, гоÑизонÑалÑÐ½Ð°Ñ Ð¾ÑÑ ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво вÑеменнÑÑ Ð¸Ð½ÑеÑвалов, а веÑÑикалÑÐ½Ð°Ñ Ð¾ÑÑ ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð². ÐаждÑй из ÑÑÐµÑ Ð½Ð°Ð±Ð¾Ñов паÑамеÑÑов пÑименÑеÑÑÑ Ð´Ð»Ñ ÐºÐ¾Ð½ÐºÑеÑного вÑеменного инÑеÑвала. ÐапÑимеÑ, пеÑвÑй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов (Ð½Ð°Ð±Ð¾Ñ 1 паÑамеÑÑов) пÑименÑеÑÑÑ Ð´Ð»Ñ Ð²Ñеменного инÑеÑвала #1, вÑоÑой Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов (Ð½Ð°Ð±Ð¾Ñ 2 паÑамеÑÑов) пÑименÑеÑÑÑ Ð´Ð»Ñ Ð²Ñеменного инÑеÑвала #5, а ÑÑеÑий Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов (Ð½Ð°Ð±Ð¾Ñ 3 паÑамеÑÑов) пÑименÑеÑÑÑ Ð´Ð»Ñ Ð²Ñеменного инÑеÑвала #9. ÐабоÑÑ Ð¿Ð°ÑамеÑÑов могÑÑ Ð±ÑÑÑ Ð¿ÑÐ¸Ð¼ÐµÐ½ÐµÐ½Ñ Ð´Ð»Ñ Ð´ÑÑÐ³Ð¸Ñ Ð²ÑеменнÑÑ Ð¸Ð½ÑеÑвалов поÑÑедÑÑвом инÑеÑполÑÑии и/или копиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð½Ð°Ð±Ð¾Ñов паÑамеÑÑов Ð´Ð»Ñ ÑÑÐ¸Ñ Ð²ÑеменнÑÑ Ð¸Ð½ÑеÑвалов. РобÑем ÑлÑÑае колиÑеÑÑво набоÑов паÑамеÑÑов Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¼ÐµÐ½ÑÑе или Ñавно колиÑеÑÑÐ²Ñ Ð²ÑеменнÑÑ Ð¸Ð½ÑеÑвалов, а колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¼ÐµÐ½ÑÑе или Ñавно колиÑеÑÑÐ²Ñ ÑаÑÑоÑнÑÑ Ð¿Ð¾Ð»Ð¾Ñ Ð°ÑдиоÑигнала. ÐоÑÑедÑÑвом кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑии Ð´Ð»Ñ Ð½ÐµÐºÐ¾ÑоÑÑÑ ÑаÑÑей вÑеменной-ÑаÑÑоÑной облаÑÑи аÑдиоÑигнала вмеÑÑо Ñого, ÑÑÐ¾Ð±Ñ Ð´ÐµÐ»Ð°ÑÑ ÑÑо Ð´Ð»Ñ Ð²Ñей вÑеменной-ÑаÑÑоÑной облаÑÑи аÑдиоÑигнала, можно ÑменÑÑиÑÑ Ð¾Ð±Ñем пÑоÑÑÑанÑÑвенной инÑоÑмаÑии, поÑÑлаемой Ð¾Ñ ÐºÐ¾Ð´ÐµÑа на декодеÑ. ÐÑо ÑокÑаÑение обÑема даннÑÑ Ð²Ð¾Ð·Ð¼Ð¾Ð¶Ð½Ð¾ поÑомÑ, ÑÑо ÑоглаÑно извеÑÑнÑм пÑинÑипам пеÑÑепÑионного аÑдиокодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑазÑÑженной инÑоÑмаÑии во вÑеменной-ÑаÑÑоÑной облаÑÑи ÑаÑÑÐ¾Ñ ÑаÑÑо бÑÐ²Ð°ÐµÑ Ð´Ð¾ÑÑаÑоÑно Ð´Ð»Ñ Ð²Ð¾ÑпÑиÑÑÐ¸Ñ Ñеловеком звÑка.Turning to FIG. 6B, where a time / frequency graph shows the relationship between parameter sets and time intervals. In the shown example, three sets of parameters (set of 1 parameters, set of 2 parameters, set of 3 parameters) are used for an ordered set of 12 time intervals in one spatial frame. In this case, the entire frequency range of the audio signal is divided into 9 parametric ranges. Thus, the horizontal axis indicates the number of time intervals, and the vertical axis indicates the number of parametric ranges. Each of the three sets of parameters is applied to a specific time interval. For example, the first set of parameters (set of 1 parameters) is used for time interval # 1, the second set of parameters (set of 2 parameters) is used for time interval # 5, and the third set of parameters (set of 3 parameters) is used for time interval # 9. The parameter sets can be applied to other time intervals by interpolating and / or copying the parameter sets for these time intervals. In general, the number of parameter sets may be less than or equal to the number of time intervals, and the number of parametric ranges may be less than or equal to the number of frequency bands of the audio signal. By encoding spatial information for some parts of the time-frequency region of the audio signal, instead of doing this for the entire time-frequency region of the audio signal, it is possible to reduce the amount of spatial information sent from the encoder to the decoder. This reduction in the amount of data is possible because, according to the well-known principles of perceptual audio coding of discharged information in the time-frequency range of frequencies, it is often enough for a person to perceive sound.
ÐажнÑм пÑизнаком ÑаÑкÑÑÑÑÑ Ð·Ð´ÐµÑÑ Ð²Ð°ÑианÑов оÑÑÑеÑÑÐ²Ð»ÐµÐ½Ð¸Ñ Ð¸Ð·Ð¾Ð±ÑеÑÐµÐ½Ð¸Ñ ÑвлÑеÑÑÑ ÐºÐ¾Ð´Ð¸Ñование и декодиÑование положений вÑеменнÑÑ Ð¸Ð½ÑеÑвалов, Ð´Ð»Ñ ÐºÐ¾ÑоÑÑÑ Ð¿ÑименÑÑÑÑÑ Ð½Ð°Ð±Ð¾ÑÑ Ð¿Ð°ÑамеÑÑов, Ñ Ð¸ÑполÑзованием ÑикÑиÑованного или пеÑеменного колиÑеÑÑва биÑ. ÐолиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ñакже Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ÑикÑиÑованнÑм колиÑеÑÑвом Ð±Ð¸Ñ Ð¸Ð»Ð¸ пеÑеменнÑм колиÑеÑÑвом биÑ. Ð¡Ñ ÐµÐ¼Ð° кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ñ Ð¿ÐµÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ Ñакже Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿Ñименена к дÑÑгой инÑоÑмаÑии, иÑполÑзÑемой пÑи пÑоÑÑÑанÑÑвенном аÑдиокодиÑовании, в Ñом ÑиÑле, но не ÑолÑко, к инÑоÑмаÑии, ÑвÑзанной Ñ Ð²Ñеменной, пÑоÑÑÑанÑÑвенной и/или ÑаÑÑоÑной облаÑÑÑми (напÑимеÑ, Ð´Ð»Ñ Ð½ÐµÑколÑÐºÐ¸Ñ ÑаÑÑоÑнÑÑ Ð¿Ð¾Ð´Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² на вÑÑ Ð¾Ð´Ðµ гÑебенки ÑилÑÑÑов).An important feature of the embodiments disclosed herein is the encoding and decoding of the positions of time slots for which sets of parameters are applied using a fixed or variable number of bits. The number of parametric ranges can also be represented by a fixed number of bits or a variable number of bits. A coding scheme with a variable number of bits can also be applied to other information used in spatial audio coding, including, but not limited to, information related to the time, spatial and / or frequency domains (for example, for several frequency subbands at the output of a comb filters).
Ðа Ñиг. 7Рпоказан ÑинÑакÑÐ¸Ñ Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¸Ð½ÑоÑмаÑии о конÑигÑÑаÑии пÑоÑÑÑанÑÑвенного инÑоÑмаÑионного Ñигнала ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. ÐнÑоÑмаÑÐ¸Ñ Ð¾ конÑигÑÑаÑии вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¼Ð½Ð¾Ð¶ÐµÑÑво полей Ñ 701 по 718, коÑоÑÑм Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑиÑвоено некоÑоÑое колиÑеÑÑво биÑ.In FIG. 7A shows a syntax for representing spatial information signal configuration information according to one embodiment of the present invention. The configuration information includes a plurality of fields 701 to 718, to which a number of bits can be assigned.
Ðоле âbsSamplingFreqencyIndexâ 701 ÑказÑÐ²Ð°ÐµÑ ÑаÑÑоÑÑ Ð´Ð¸ÑкÑеÑизаÑии, полÑÑеннÑÑ Ð¸Ð· пÑоÑеÑÑа диÑкÑеÑизаÑии аÑдиоÑигнала. ÐÐ»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÑаÑÑоÑÑ Ð´Ð¸ÑкÑеÑизаÑии Ð¿Ð¾Ð»Ñ âbsSamplingFreqencyIndexâ 701 вÑделено 4 биÑа. ÐÑли знаÑение Ð¿Ð¾Ð»Ñ âbsSamplingFreqencyIndexâ 701 ÑоÑÑавлÑÐµÑ 15, Ñо еÑÑÑ Ð´Ð²Ð¾Ð¸Ñное ÑиÑло 1111, Ñо добавлÑеÑÑÑ Ð¿Ð¾Ð»Ðµ âbsSamplingFreqencyâ 702 Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÑаÑÑоÑÑ Ð´Ð¸ÑкÑеÑизаÑии. Ð ÑÑом ÑлÑÑае Ð¿Ð¾Ð»Ñ âbsSamplingFreqencyâ 702 вÑделÑеÑÑÑ 24 биÑа.The âbsSamplingFreqencyIndexâ 701 field indicates the sampling rate obtained from the sampling process of the audio signal. To represent the sampling rate, 4 bits are allocated to the âbsSamplingFreqencyIndexâ 701 field. If the value of the âbsSamplingFreqencyIndexâ 701 field is 15, that is, the binary number 1111, then the âbsSamplingFreqencyâ 702 field is added to represent the sampling frequency. In this case, the âbsSamplingFreqencyâ 702 field is allocated 24 bits.
Ðоле âbsFrameLengthâ 703 ÑказÑÐ²Ð°ÐµÑ Ð¾Ð±Ñее колиÑеÑÑво вÑеменнÑÑ Ð¸Ð½ÑеÑвалов (далее назÑваемое ânumSlotsâ) в одном пÑоÑÑÑанÑÑвенном кадÑе, пÑиÑем Ð¼ÐµÐ¶Ð´Ñ ânumSlotsâ и полем âbsFrameLengthâ 703 Ð¼Ð¾Ð¶ÐµÑ Ð¸Ð¼ÐµÑÑ Ð¼ÐµÑÑо ÑооÑноÑение NumSlots = bsFrameLength+1.The âbsFrameLengthâ field 703 indicates the total number of time slots (hereinafter referred to as ânumSlotsâ) in one spatial frame, and the relation NumSlots = bsFrameLength + 1 may occur between ânumSlotsâ and the âbsFrameLengthâ 703 field.
Ðоле âbsFreqResâ 704 ÑказÑÐ²Ð°ÐµÑ Ð¾Ð±Ñее колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², Ð¾Ñ Ð²Ð°ÑÑваÑÑÐ¸Ñ Ð²ÑÑ ÑаÑÑоÑнÑÑ Ð¾Ð±Ð»Ð°ÑÑÑ Ð°ÑдиоÑигнала. Ðоле âbsFreqResâ 704 обÑÑÑнÑеÑÑÑ Ð½Ð¸Ð¶Ðµ на Ñиг. 7Ð.The âbsFreqResâ field 704 indicates the total number of parametric ranges covering the entire frequency domain of the audio signal. The âbsFreqResâ field 704 is explained below in FIG. 7B.
Ðоле âbsTreeConfigâ 705 ÑказÑÐ²Ð°ÐµÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð´Ð»Ñ Ð´Ñевовидной конÑигÑÑаÑии, вклÑÑаÑÑей в ÑÐµÐ±Ñ Ð¼Ð½Ð¾Ð¶ÐµÑÑво модÑлей пÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð², ÑÐ°ÐºÐ¸Ñ ÐºÐ°Ðº бÑли опиÑÐ°Ð½Ñ Ñо ÑÑÑлками на Ñиг. 4. ÐнÑоÑмаÑÐ¸Ñ Ð´Ð»Ñ Ð´Ñевовидной конÑигÑÑаÑии вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ ÑакÑÑ Ð¸Ð½ÑоÑмаÑиÑ, как Ñип модÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð², колиÑеÑÑво модÑлей пÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð², Ñип пÑоÑÑÑанÑÑвенной инÑоÑмаÑии, иÑполÑзÑемой в модÑле пÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð², колиÑеÑÑво Ð²Ñ Ð¾Ð´Ð½ÑÑ /вÑÑ Ð¾Ð´Ð½ÑÑ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² аÑдиоÑигнала и Ñ.д.The âbsTreeConfigâ field 705 indicates information for a tree configuration including a plurality of channel conversion modules, such as those described with reference to FIG. 4. Information for the tree configuration includes information such as the type of channel conversion module, the number of channel conversion modules, the type of spatial information used in the channel conversion module, the number of audio input / output channels, etc.
ÐÑÐµÐ²Ð¾Ð²Ð¸Ð´Ð½Ð°Ñ ÐºÐ¾Ð½ÑигÑÑаÑÐ¸Ñ Ð¼Ð¾Ð¶ÐµÑ Ð¸Ð¼ÐµÑÑ Ð¾Ð´Ð½Ñ Ð¸Ð· ÑледÑÑÑÐ¸Ñ ÐºÐ¾Ð½ÑигÑÑаÑий: конÑигÑÑаÑÐ¸Ñ 5-1-5, конÑигÑÑаÑÐ¸Ñ 5-2-5, конÑигÑÑаÑÐ¸Ñ 7-2-7, конÑигÑÑаÑÐ¸Ñ 7-5-7 и Ñ.п., в ÑооÑвеÑÑÑвии Ñ Ñипом модÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² или колиÑеÑÑвом каналов. Ðа Ñиг. 4 показана дÑÐµÐ²Ð¾Ð²Ð¸Ð´Ð½Ð°Ñ ÐºÐ¾Ð½ÑигÑÑаÑÐ¸Ñ 5-2-5.The tree configuration can have one of the following configurations: configuration 5-1-5, configuration 5-2-5, configuration 7-2-7, configuration 7-5-7, etc., according to the type of channel conversion module or number of channels. In FIG. 4 shows a tree configuration 5-2-5.
Ðоле 706 âbsQuantModeâ ÑказÑÐ²Ð°ÐµÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ Ñежиме кванÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑии. Field 706 âbsQuantModeâ indicates information about the quantization mode of spatial information.
Ðоле âbsOneIccâ 707 ÑказÑваеÑ, иÑполÑзÑеÑÑÑ Ð»Ð¸ Ð´Ð»Ñ Ð²ÑÐµÑ Ð±Ð»Ð¾ÐºÐ¾Ð² OTT один Ð¿Ð¾Ð´Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов ICC. Ð ÑÑом ÑлÑÑае Ð¿Ð¾Ð´Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов ознаÑÐ°ÐµÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, пÑимененнÑÑ Ð´Ð»Ñ ÐºÐ¾Ð½ÐºÑеÑного вÑеменного инÑеÑвала и конкÑеÑного модÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð².The bsOneIcc field 707 indicates whether a single subset of ICC parameters is used for all OTT blocks. In this case, a subset of parameters means a set of parameters applied for a specific time interval and a specific channel conversion module.
Ðоле âbsArbitraryDownmixâ 708 ÑказÑÐ²Ð°ÐµÑ Ð½Ð°Ð»Ð¸Ñие или оÑÑÑÑÑÑвие пÑоизволÑно вÑбÑанного коÑÑÑиÑиенÑа ÑÑÐ¸Ð»ÐµÐ½Ð¸Ñ Ð¿Ñи понижаÑÑем микÑиÑовании. Ðоле âbsFixedGainSurâ 709 ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾ÑÑÑиÑÐ¸ÐµÐ½Ñ ÑÑилениÑ, пÑименÑемÑй Ð´Ð»Ñ Ð¾Ð±Ñемного канала, напÑимеÑ, LS (левÑй канал обÑемного звÑÑаниÑ) и RS (пÑавÑй канал обÑемного звÑÑаниÑ).The âbsArbitraryDownmixâ field 708 indicates the presence or absence of an arbitrarily selected gain during downmix. The âbsFixedGainSurâ field 709 indicates the gain used for the surround channel, for example LS (left surround channel) and RS (right surround channel).
Ðоле âbsFixedGainLFâ 710 ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾ÑÑÑиÑÐ¸ÐµÐ½Ñ ÑÑилениÑ, пÑименÑемÑй Ð´Ð»Ñ ÐºÐ°Ð½Ð°Ð»Ð° LFE.The âbsFixedGainLFâ field 710 indicates the gain applied to the LFE channel.
Ðоле âbsFixedGainDMâ 711 ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾ÑÑÑиÑÐ¸ÐµÐ½Ñ ÑÑилениÑ, пÑименÑемÑй Ð´Ð»Ñ Ñигнала, ÑвлÑÑÑегоÑÑ ÑезÑлÑÑаÑом понижаÑÑего микÑиÑованиÑ.The âbsFixedGainDMâ field 711 indicates the gain applied to the signal resulting from the downmix.
Ðоле âbsMatrixModeâ 712 ÑказÑваеÑ, ÑоздаеÑÑÑ Ð»Ð¸ в кодеÑе маÑÑиÑно ÑовмеÑÑимÑй ÑÑеÑеоÑигнал поÑле понижаÑÑего микÑиÑованиÑ.The âbsMatrixModeâ 712 field indicates whether a matrix-compatible stereo signal is generated in the encoder after down-mixing.
Ðоле âbsTempShapeConfigâ 713 ÑказÑÐ²Ð°ÐµÑ ÑабоÑий Ñежим вÑеменного ÑоÑмиÑÐ¾Ð²Ð°Ð½Ð¸Ñ (напÑимеÑ, TES (ÑоÑмиÑование вÑеменной огибаÑÑей) и/или TP (вÑеменное ÑоÑмиÑование)) в декодеÑе.The âbsTempShapeConfigâ 713 field indicates the operating mode of temporal shaping (eg, TES (temporal envelope shaping) and / or TP (temporal shaping)) in the decoder.
Ðоле âbsDecorrConfigâ 714 ÑказÑÐ²Ð°ÐµÑ ÑабоÑий Ñежим декоÑÑелÑÑоÑа декодеÑа.The âbsDecorrConfigâ field 714 indicates the operational mode of the decoder decorrelator.
Рполе âbs3DaudioÐodeâ 715 ÑказÑваеÑ, закодиÑован ли Ñигнал поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð² 3D (ÑÑÐµÑ Ð¼ÐµÑнÑй) Ñигнал и иÑполÑзована ли обÑабоÑка Ñ Ð¿Ñименением обÑаÑной ÑÑнкÑии HRTF (ÑÑнкÑÐ¸Ñ Ð¼Ð¾Ð´ÐµÐ»Ð¸ÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð²Ð¾ÑпÑиÑÑÐ¸Ñ Ð·Ð²Ñка Ñеловеком).And the âbs3DaudioModeâ field 715 indicates whether the signal after downmixing is encoded into a 3D (three-dimensional) signal and whether processing using the inverse HRTF function (human perception modeling function) is used.
ÐоÑле Ñого как бÑла опÑеделена/извлеÑена инÑоÑмаÑÐ¸Ñ Ð¸Ð· каждого Ð¿Ð¾Ð»Ñ Ð² кодеÑе/декодеÑе, в кодеÑе/декодеÑе опÑеделÑеÑÑÑ/извлекаеÑÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð´Ð»Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð¼Ð¾Ð´ÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð². СнаÑала опÑеделÑеÑÑÑ/извлекаеÑÑÑ (716) колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° OTT, а заÑем опÑеделÑеÑÑÑ/извлекаеÑÑÑ (717) колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° TTT. ÐолиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° ATT и/или блока TTT бÑÐ´ÐµÑ Ð¿Ð¾Ð´Ñобно опиÑано Ñо ÑÑÑлками на ÑигÑÑÑ Ñ 8Рпо 9Ð.After the information from each field in the encoder / decoder has been determined / extracted, information for the number of parametric ranges used for the channel conversion module is determined / extracted in the encoder / decoder. First, the number of parametric ranges used for the OTT block is determined / extracted (716), and then the number of parametric ranges used for the TTT block is determined / extracted (717). The number of parametric ranges for the ATT block and / or the TTT block will be described in detail with reference to figures 8A through 9B.
Ð ÑлÑÑае когда ÑÑÑеÑÑвÑÐµÑ ÐºÐ°Ð´Ñ ÑаÑÑиÑениÑ, блок âspatialExtensionConfigâ 718 вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ конÑигÑÑаÑии Ð´Ð»Ñ ÐºÐ°Ð´Ñа ÑаÑÑиÑениÑ. ÐнÑоÑмаÑиÑ, вклÑÑÐµÐ½Ð½Ð°Ñ Ð² блок âspatialExtensionConfigâ 718, опиÑÑваеÑÑÑ Ð½Ð¸Ð¶Ðµ Ñо ÑÑÑлками на ÑигÑÑÑ Ñ 10Рпо 10D.In the case where an extension frame exists, the âspatialExtensionConfigâ block 718 includes configuration information for the extension frame. The information included in the spatialExtensionConfig block 718 is described below with reference to Figures 10A through 10D.
Ðа Ñиг. 7РпÑедÑÑавлена ÑаблиÑа Ð´Ð»Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ñигнала Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. ânumBandsâ ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð´Ð»Ñ Ð²Ñей ÑаÑÑоÑной облаÑÑи аÑдиоÑигнала, а âbsFreqResâ ÑказÑÐ²Ð°ÐµÑ Ð¸Ð½Ð´ÐµÐºÑнÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð´Ð»Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð². ÐапÑимеÑ, вÑÑ ÑаÑÑоÑÐ½Ð°Ñ Ð¾Ð±Ð»Ð°ÑÑÑ Ð°ÑдиоÑигнала по Ð¶ÐµÐ»Ð°Ð½Ð¸Ñ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ ÑазбиÑа на неÑколÑко паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² (напÑимеÑ, 4, 5, 7, 10, 14, 20, 28 и Ñ.д.).In FIG. 7B is a table for the number of parametric ranges of a spatial information signal according to one embodiment of the present invention. âNumBandsâ indicates the number of parametric ranges for the entire frequency domain of the audio signal, and âbsFreqResâ indicates index information for the number of parametric ranges. For example, the entire frequency domain of an audio signal can be optionally divided into several parametric ranges (for example, 4, 5, 7, 10, 14, 20, 28, etc.).
РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð¾Ð´Ð¸Ð½ паÑамеÑÑ Ð¼Ð¾Ð¶ÐµÑ Ð¿ÑименÑÑÑÑÑ Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ паÑамеÑÑиÑеÑкого диапазона. ÐапÑимеÑ, еÑли ânumBandsâ ÑоÑÑавлÑÐµÑ 28, Ñо Ñогда вÑÑ ÑаÑÑоÑÐ½Ð°Ñ Ð¾Ð±Ð»Ð°ÑÑÑ Ð°ÑдиоÑигнала ÑазбиваеÑÑÑ Ð½Ð° 28 паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², и каждÑй из 28 паÑамеÑÑов Ð¼Ð¾Ð¶ÐµÑ Ð¿ÑименÑÑÑÑÑ Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ из 28 паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð². РдÑÑгом пÑимеÑе еÑли ânumBandsâ Ñавно 4, Ñо Ñогда вÑÑ ÑаÑÑоÑÐ½Ð°Ñ Ð¾Ð±Ð»Ð°ÑÑÑ Ð´Ð°Ð½Ð½Ð¾Ð³Ð¾ аÑдиоÑигнала ÑазбиваеÑÑÑ Ð½Ð° 4 паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð°, и каждÑй из 4 паÑамеÑÑов Ð¼Ð¾Ð¶ÐµÑ Ð¿ÑименÑÑÑÑÑ Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ из 4 паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð². Ðа Ñиг. 7Ð ÑеÑмин âÐаÑезеÑвиÑованоâ ознаÑаеÑ, ÑÑо колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð´Ð»Ñ Ð²Ñей ÑаÑÑоÑной облаÑÑи данного аÑдиоÑигнала не опÑеделено.In some embodiments, one parameter may be applied for each parametric range. For example, if ânumBandsâ is 28, then the entire frequency domain of the audio signal is divided into 28 parametric ranges, and each of 28 parameters can be applied to each of 28 parametric ranges. In another example, if ânumBandsâ is 4, then the entire frequency domain of this audio signal is divided into 4 parametric ranges, and each of 4 parameters can be applied to each of the 4 parametric ranges. In FIG. 7B, the term âReservedâ means that the number of parametric ranges for the entire frequency domain of a given audio signal is not defined.
СледÑÐµÑ Ð·Ð°Ð¼ÐµÑиÑÑ, ÑÑо оÑган ÑлÑÑ Ð° Ñеловека не ÑÑвÑÑвиÑелен к колиÑеÑÑÐ²Ñ Ð¿Ð°ÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², иÑполÑзÑемÑÑ Ð² ÑÑ ÐµÐ¼Ðµ кодиÑованиÑ. Таким обÑазом, иÑполÑзование неболÑÑого колиÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð¼Ð¾Ð¶ÐµÑ Ð¾Ð±ÐµÑпеÑиÑÑ Ñакой же пÑоÑÑÑанÑÑвеннÑй аÑдиоÑÑÑÐµÐºÑ Ð´Ð»Ñ ÑлÑÑаÑелÑ, как еÑли Ð±Ñ Ð¸ÑполÑзовалоÑÑ Ð±Ð¾Ð»ÑÑее колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð².It should be noted that the human hearing organ is not sensitive to the number of parametric ranges used in the coding scheme. Thus, the use of a small number of parametric ranges can provide the same spatial audio effect for the listener as if more parametric ranges were used.
РоÑлиÑие Ð¾Ñ Ð¿Ð°ÑамеÑÑа ânumBandsâ, паÑамеÑÑ ânumSlotsâ, пÑедÑÑавленнÑй полем âbsFrameLengthâ 703, показаннÑм на Ñиг. 7Ð, Ð¼Ð¾Ð¶ÐµÑ Ð¿ÑедÑÑавлÑÑÑ Ð²Ñе знаÑениÑ. Ðднако знаÑÐµÐ½Ð¸Ñ ânumSlotsâ могÑÑ Ð±ÑÑÑ Ð¾Ð³ÑаниÑенÑ, еÑли колиÑеÑÑво оÑÑÑеÑов в одном пÑоÑÑÑанÑÑвенном кадÑе ÑоÑно делиÑÑÑ Ð½Ð° ânumSlotsâ. Таким обÑазом, еÑли макÑималÑное пÑедÑÑавлÑемое знаÑение ânumSlotsâ Ñавно 'b', Ñо каждое знаÑение Ð¿Ð¾Ð»Ñ âbsFrameLengthâ 703 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ceil{log2(b)} биÑами. Ð ÑÑом ÑлÑÑае 'ceil(x)' ознаÑÐ°ÐµÑ Ð¼Ð¸Ð½Ð¸Ð¼Ð°Ð»Ñное Ñелое ÑиÑло, болÑÑее или Ñавное знаÑÐµÐ½Ð¸Ñ 'x'. ÐапÑимеÑ, еÑли один пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ Ð²ÐºÐ»ÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ 72 вÑеменнÑÑ Ð¸Ð½ÑеÑвала, Ñо Ñогда Ð´Ð»Ñ Ð¿Ð¾Ð»Ñ âbsFrameLengthâ 703 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²Ñделено ceil{log2(72)} = 7 биÑ, и колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð¼Ð¾Ð´ÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð², Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑинÑÑо ÑавнÑм знаÑÐµÐ½Ð¸Ñ Ð² пÑÐµÐ´ÐµÐ»Ð°Ñ ânumBandsâ.Unlike the ânumBandsâ parameter, the ânumSlotsâ parameter represented by the âbsFrameLengthâ 703 field shown in FIG. 7A may represent all values. However, the ânumSlotsâ values may be limited if the number of samples in one spatial frame is exactly divided by ânumSlotsâ. Thus, if the maximum represented value of ânumSlotsâ is 'b', then each value of the âbsFrameLengthâ 703 field may be represented by ceil {log 2 (b)} bits. In this case, 'ceil (x)' means the smallest integer greater than or equal to the value of 'x'. For example, if one spatial frame includes 72 time slots, then for the âbsFrameLengthâ 703 field, ceil {log 2 (72)} = 7 bits can be allocated, and the number of parametric ranges used for the channel transform module can be taken equal to the value within ânumBandsâ.
Ðа Ñиг. 8Рпоказан ÑинÑакÑÐ¸Ñ Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° OTT, Ñ Ð¿Ð¾Ð¼Ð¾ÑÑÑ ÑикÑиÑованного колиÑеÑÑва Ð±Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. ÐбÑаÑимÑÑ Ðº ÑигÑÑам 7Ри 8Ð, где 'i' Ð¸Ð¼ÐµÐµÑ Ð·Ð½Ð°Ñение Ð¾Ñ Ð½ÑÐ»Ñ Ð´Ð¾ numOttBoxes - 1 и где 'numOttBoxes' - обÑее колиÑеÑÑво блоков OTT. Рименно, знаÑение 'i' ÑказÑÐ²Ð°ÐµÑ ÐºÐ°Ð¶Ð´Ñй блок OTT, а колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемое Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ блока OTT, пÑедÑÑавлено ÑооÑвеÑÑÑвÑÑÑим знаÑением 'i'. ÐÑли блок OTT Ð¸Ð¼ÐµÐµÑ Ñежим канала LFE, Ñо колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² (обознаÑенное далее как âbsOttBandsâ), пÑименÑемое Ð´Ð»Ñ ÐºÐ°Ð½Ð°Ð»Ð° LFE блока OTT, можно пÑедÑÑавиÑÑ Ñ Ð¸ÑполÑзованием ÑикÑиÑованного колиÑеÑÑва биÑ. РпÑимеÑе, показанном на Ñиг.8Ð, Ð´Ð»Ñ Ð¿Ð¾Ð»Ñ âbsOttBandsâ 801 вÑделено 5 биÑ. ÐÑли блок OTT не Ð¸Ð¼ÐµÐµÑ Ñежим канала LFE, Ñо Ð´Ð»Ñ ÐºÐ°Ð½Ð°Ð»Ð° блока OTT Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿Ñименено обÑее колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² (numBands).In FIG. 8A shows a syntax for representing the number of parametric ranges applied to an OTT block using a fixed number of bits according to one embodiment of the present invention. Referring to Figures 7A and 8A, where 'i' has a value from zero to numOttBoxes - 1 and where 'numOttBoxes' is the total number of OTT blocks. Namely, the value of 'i' indicates each OTT block, and the number of parametric ranges used for each OTT block is represented by the corresponding value of 'i'. If the OTT block has an LFE channel mode, then the number of parametric ranges (hereinafter referred to as âbsOttBandsâ) used for the LFE channel of the OTT block can be represented using a fixed number of bits. In the example shown in FIG. 8A, 5 bits are allocated for the âbsOttBandsâ 801 field. If the OTT block does not have LFE channel mode, then the total number of parametric ranges (numBands) can be applied to the channel of the OTT block.
Ðа Ñиг. 8Рпоказан ÑинÑакÑÐ¸Ñ Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° OTT, Ñ Ð¿ÐµÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. Ðа Ñиг. 8Ð, коÑоÑÐ°Ñ Ð°Ð½Ð°Ð»Ð¾Ð³Ð¸Ñна Ñиг. 8Ð, в оÑлиÑие Ð¾Ñ Ñиг. 8Рполе âbsOttBandsâ 802, показанное на Ñиг. 8Ð, пÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом биÑ. Ð ÑаÑÑноÑÑи, поле âbsOttBandsâ 802, знаÑение коÑоÑого менÑÑе или Ñавно ânumBandsâ, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ Ñ Ð¸ÑполÑзованием ânumBandsâ.In FIG. 8B shows a syntax for representing the number of parametric ranges used for an OTT block with a variable number of bits according to one embodiment of the present invention. In FIG. 8B, which is similar to FIG. 8A, in contrast to FIG. 8A, the âbsOttBandsâ field 802 shown in FIG. 8B is represented by a variable number of bits. In particular, the âbsOttBandsâ 802 field, whose value is less than or equal to ânumBandsâ, can be represented by a variable number of bits using ânumBandsâ.
ÐÑли ânumBandsâ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑ Ð² диапазоне, болÑÑем или ÑавнÑм 2(n-1) и менÑÑим 2(n), Ñо поле âbsOttBandsâ 802 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ n.If ânumBandsâ is in the range greater than or equal to 2 (n-1) and less than 2 (n) , then the field âbsOttBandsâ 802 can be represented by a variable number of bits n.
ÐапÑимеÑ: (а) еÑли ânumBandsâ Ñавно 40, Ñо поле âbsOttBandsâ 802 пÑедÑÑавлÑеÑÑÑ 6 биÑами; (b) еÑли ânumBandsâ Ñавно 28 или 20, Ñо поле âbsOttBandsâ 802 пÑедÑÑавлÑеÑÑÑ 5 биÑами; (Ñ) еÑли ânumBandsâ Ñавно 14 или 10, Ñо поле âbsOttBandsâ 802 пÑедÑÑавлÑеÑÑÑ 4 биÑами; и (d) еÑли ânumBandsâ Ñавно 7, 5 или 4, Ñо поле âbsOttBandsâ 802 пÑедÑÑавлÑеÑÑÑ 3 биÑами.For example: (a) if ânumBandsâ is 40, then the âbsOttBandsâ 802 field is represented by 6 bits; (b) if ânumBandsâ is 28 or 20, then the âbsOttBandsâ 802 field is represented by 5 bits; (c) if ânumBandsâ is 14 or 10, then the âbsOttBandsâ 802 field is represented by 4 bits; and (d) if ânumBandsâ is 7, 5, or 4, then the âbsOttBandsâ 802 field is represented by 3 bits.
ÐÑли ânumBandsâ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑ Ð² диапазоне, болÑÑем Ñем 2(n-1) и менÑÑем или ÑавнÑм 2(n), Ñо поле âbsOttBandsâ 802 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ n.If ânumBandsâ is in the range greater than 2 (n-1) and less than or equal to 2 (n) , then the field âbsOttBandsâ 802 can be represented by a variable number of bits n.
ÐапÑимеÑ: (а) еÑли ânumBandsâ Ñавно 40, Ñо поле âbsOttBandsâ 802 пÑедÑÑавлÑеÑÑÑ 6 биÑами; (b) еÑли ânumBandsâ Ñавно 28 или 20, Ñо поле âbsOttBandsâ 802 пÑедÑÑавлÑеÑÑÑ 5 биÑами; (Ñ) еÑли ânumBandsâ Ñавно 14 или 10, Ñо поле âbsOttBandsâ 802 пÑедÑÑавлÑеÑÑÑ 4 биÑами; (d) еÑли ânumBandsâ Ñавно 7, 5, Ñо поле âbsOttBandsâ 802 пÑедÑÑавлÑеÑÑÑ 3 биÑами; и (e) еÑли ânumBandsâ Ñавно 4, Ñо поле âbsOttBandsâ 802 пÑедÑÑавлÑеÑÑÑ 2 биÑами.For example: (a) if ânumBandsâ is 40, then the âbsOttBandsâ 802 field is represented by 6 bits; (b) if ânumBandsâ is 28 or 20, then the âbsOttBandsâ 802 field is represented by 5 bits; (c) if ânumBandsâ is 14 or 10, then the âbsOttBandsâ 802 field is represented by 4 bits; (d) if ânumBandsâ is 7, 5, then the âbsOttBandsâ 802 field is represented by 3 bits; and (e) if ânumBandsâ is 4, then the âbsOttBandsâ 802 field is represented by 2 bits.
Ðоле âbsOttBandsâ 802 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ ÑеÑез ÑÑнкÑÐ¸Ñ (далее назÑваемÑÑ âÑÑнкÑÐ¸Ñ Ð½Ð°Ð¸Ð¼ÐµÐ½ÑÑего Ñелогоâ) окÑÑÐ³Ð»ÐµÐ½Ð¸Ñ Ð´Ð¾ ближайÑего Ñелого знаÑениÑ, где в каÑеÑÑве пеÑеменной беÑеÑÑÑ ânumBandsâ.The âbsOttBandsâ 802 field can be represented by a variable number of bits through a function (hereinafter referred to as the âsmallest integer functionâ) rounding to the nearest integer value, where ânumBandsâ is taken as a variable.
Ð ÑаÑÑноÑÑи: (i) в ÑлÑÑае когда 0 < bsOttBands ⤠numBands или 0 ⤠bsOttBands < numBands, поле âbsOttBandsâ 802 пÑедÑÑавлÑеÑÑÑ ÐºÐ¾Ð»Ð¸ÑеÑÑвом биÑ, ÑооÑвеÑÑÑвÑÑÑим знаÑÐµÐ½Ð¸Ñ ceil(log2(numBands)); или (ii) в ÑлÑÑае когда 0 ⤠bsOttBands ⤠numBands, поле âbsOttBandsâ 802 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ceil(log2(numBands+1)) биÑами.In particular: (i) in the case when 0 <bsOttBands ⤠numBands or 0 ⤠bsOttBands <numBands, the âbsOttBandsâ 802 field is represented by the number of bits corresponding to the value of ceil (log 2 (numBands)); or (ii) in the case where 0 ⤠bsOttBands ⤠numBands, the âbsOttBandsâ 802 field may be represented by ceil (log 2 (numBands + 1)) bits.
ÐÑли знаÑение, менÑÑее или Ñавное ânumBandsâ (назÑваемое далее ânumberBandsâ), опÑеделено пÑоизволÑно, Ñо поле âbsOttBandsâ 802 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ ÑеÑез ÑÑнкÑÐ¸Ñ Ð½Ð°Ð¸Ð¼ÐµÐ½ÑÑего Ñелого, еÑли в каÑеÑÑве пеÑеменной пÑинÑÑÑ ânumberBandsâ.If a value less than or equal to ânumBandsâ (hereinafter referred to as ânumberBandsâ) is arbitrarily defined, then the field âbsOttBandsâ 802 can be represented by a variable number of bits through the function of the smallest integer, if ânumberBandsâ is taken as a variable.
Ð ÑаÑÑноÑÑи: (i) в ÑлÑÑае когда 0 < bsOttBands ⤠numberBands или 0 ⤠bsOttBands < numberBands, поле âbsOttBandsâ 802 пÑедÑÑавлÑеÑÑÑ ceil(log2(numberBands)) биÑами; или (ii) в ÑлÑÑае когда 0 ⤠bsOttBands ⤠numberBands, поле âbsOttBandsâ 802 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ceil(log2(numberBands+1)) биÑами.In particular: (i) in the case when 0 <bsOttBands ⤠numberBands or 0 ⤠bsOttBands <numberBands, the field âbsOttBandsâ 802 is represented by ceil (log 2 (numberBands)) bits; or (ii) in the case where 0 ⤠bsOttBands ⤠numberBands, the âbsOttBandsâ 802 field may be represented by ceil (log 2 (numberBands + 1)) bits.
ÐÑли иÑполÑзÑеÑÑÑ Ð±Ð¾Ð»ÐµÐµ одного блока OTT, Ñо комбинаÑÐ¸Ñ âbsOttBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²ÑÑажена ÑоÑмÑлой 1, пÑиведенной ниже.If more than one OTT block is used, then the combination âbsOttBandsâ can be expressed by formula 1 below.
[ФоÑмÑла 1][Formula 1]
где bsOttBandsi ÑказÑÐ²Ð°ÐµÑ i-й âbsOttBandsâ. ÐапÑимеÑ, пÑедположим, ÑÑо имееÑÑÑ ÑÑи блока OTT и ÑÑи знаÑÐµÐ½Ð¸Ñ (N=3) Ð´Ð»Ñ Ð¿Ð¾Ð»Ñ âbsOttBandsâ 802. Ð ÑÑом пÑимеÑе ÑÑи знаÑÐµÐ½Ð¸Ñ Ð¿Ð¾Ð»Ñ âbsOttBandsâ 802 (обознаÑеннÑе далее a1, a2 и a3 ÑооÑвеÑÑÑвенно), пÑименÑемÑе Ð´Ð»Ñ ÑÑÐµÑ ÑооÑвеÑÑÑвÑÑÑÐ¸Ñ Ð±Ð»Ð¾ÐºÐ¾Ð² OTT, могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ 2 биÑами каждое. СледоваÑелÑно, Ð´Ð»Ñ Ð²ÑÑÐ°Ð¶ÐµÐ½Ð¸Ñ Ð·Ð½Ð°Ñений a1, a2 и a3 поÑÑебÑеÑÑÑ Ð²Ñего 6 биÑ. ÐÑоме Ñого, еÑли знаÑÐµÐ½Ð¸Ñ a1, a2 и a3 пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ Ð² виде гÑÑппÑ, Ñо Ñогда Ð¼Ð¾Ð¶ÐµÑ Ð²Ð¾Ð·Ð½Ð¸ÐºÐ½ÑÑÑ 27 (=3·3·3) ваÑианÑов, коÑоÑÑе могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ 5 биÑами Ñ Ñкономией одного биÑа. ÐÑли ânumBandsâ Ñавно 3, а знаÑение гÑÑппÑ, пÑедÑÑавленное 5 биÑами, Ñавно 15, Ñо знаÑение гÑÑÐ¿Ð¿Ñ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено в виде 15=1·(32)+2·(31)+0·(30). СледоваÑелÑно, декодеÑ, пÑименив обÑаÑнÑм обÑазом ÑоÑмÑÐ»Ñ 1, Ð¼Ð¾Ð¶ÐµÑ Ð¾Ð¿ÑеделиÑÑ Ð¸Ð· знаÑÐµÐ½Ð¸Ñ 15 гÑÑппÑ, ÑÑо ÑÑи знаÑÐµÐ½Ð¸Ñ a1, a2 и a3 Ð¿Ð¾Ð»Ñ âbsOttBandsâ 802 ÑоÑÑавлÑÑÑ 1, 2 и 0 ÑооÑвеÑÑÑвенно.where bsOttBands i indicates the ith âbsOttBandsâ. For example, suppose there are three OTT blocks and three values (N = 3) for the âbsOttBandsâ field 802. In this example, three values of the âbsOttBandsâ 802 field (indicated below by a1, a2, and a3, respectively) used for the three corresponding blocks OTT can be represented by 2 bits each. Therefore, only 6 bits are required to express the values of a1, a2, and a3. In addition, if the values a1, a2 and a3 are presented as a group, then 27 (= 3 · 3 · 3) options may arise, which can be represented by 5 bits with the saving of one bit. If ânumBandsâ is 3, and the group value represented by 5 bits is 15, then the group value can be represented as 15 = 1 · (3 2 ) + 2 · (3 1 ) + 0 · (3 0 ). Therefore, the decoder, applying the reverse formula 1, can determine from the value 15 of the group that the three values a1, a2 and a3 of the field âbsOttBandsâ 802 are 1, 2 and 0, respectively.
Ð ÑлÑÑае множеÑÑва блоков OTT комбинаÑÐ¸Ñ âbsOttBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена в виде одной из ÑоÑмÑл Ñ 2 по 4 (опÑеделеннÑÑ Ð½Ð¸Ð¶Ðµ) Ñ Ð¸ÑполÑзованием ânumberBandsâ. ÐоÑколÑÐºÑ Ð¿ÑедÑÑавление âbsOttBandsâ Ñ Ð¸ÑполÑзованием ânumberBandsâ аналогиÑно пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ñ Ð¸ÑполÑзованием ânumBandsâ из ÑоÑмÑÐ»Ñ 1, подÑобное обÑÑÑнение пÑедÑÑавленнÑÑ Ð½Ð¸Ð¶Ðµ ÑоÑмÑл опÑÑкаеÑÑÑ.In the case of many OTT blocks, the combination âbsOttBandsâ can be represented as one of formulas 2 through 4 (defined below) using ânumberBandsâ. Since the representation of âbsOttBandsâ using ânumberBandsâ is similar to the representation using ânumBandsâ from formula 1, a detailed explanation of the formulas below is omitted.
[ФоÑмÑла 2][Formula 2]
[ФоÑмÑла 3][Formula 3]
[ФоÑмÑла 4][Formula 4]
Ðа Ñиг. 9Рпоказан ÑинÑакÑÐ¸Ñ Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° TTT, Ñ ÑикÑиÑованнÑм колиÑеÑÑвом Ð±Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. ÐбÑаÑимÑÑ Ðº ÑигÑÑам 7Ри 9Ð, где 'i' Ð¸Ð¼ÐµÐµÑ Ð·Ð½Ð°Ñение Ð¾Ñ Ð½ÑÐ»Ñ Ð´Ð¾ numTttboxes - 1, где 'numTttboxes' - обÑее колиÑеÑÑво блоков TTT. Рименно, знаÑение 'i' ÑказÑÐ²Ð°ÐµÑ ÐºÐ°Ð¶Ð´Ñй блок TTT. ÐолиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемое Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ блока TTT, пÑедÑÑавлÑеÑÑÑ Ð² ÑооÑвеÑÑÑвии Ñо знаÑением 'i'. РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð±Ð»Ð¾Ðº TTT Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ ÑÐ°Ð·Ð±Ð¸Ñ Ð½Ð° низкоÑаÑÑоÑнÑй диапазон и вÑÑокоÑаÑÑоÑнÑй диапазон, и Ð´Ð»Ñ Ð½Ð¸Ð·ÐºÐ¾ÑаÑÑоÑного и вÑÑокоÑаÑÑоÑного диапазонов могÑÑ Ð±ÑÑÑ Ð¸ÑполÑÐ·Ð¾Ð²Ð°Ð½Ñ ÑазнÑе пÑоÑеÑÑÑ Ð¾Ð±ÑабоÑки. ÐÐ¾Ð·Ð¼Ð¾Ð¶Ð½Ñ Ð¸ дÑÑгие ваÑианÑÑ ÑазбиениÑ.In FIG. 9A shows a syntax for representing the number of parametric ranges applied to a TTT block with a fixed number of bits according to one embodiment of the present invention. Turning to figures 7A and 9A, where 'i' has a value from zero to numTttboxes - 1, where 'numTttboxes' is the total number of TTT blocks. Namely, the value of 'i' indicates each TTT block. The number of parametric ranges used for each TTT block is represented according to the value of 'i'. In some embodiments, the TTT block can be divided into a low frequency range and a high frequency range, and different processing processes can be used for the low frequency and high frequency ranges. Other splitting options are possible.
Ðоле âbsTttDualModeâ 901 ÑказÑваеÑ, ÑабоÑÐ°ÐµÑ Ð»Ð¸ даннÑй блок TTT в ÑазнÑÑ ÑÐµÐ¶Ð¸Ð¼Ð°Ñ (далее ÑÑо назÑваеÑÑÑ âдÑалÑнÑй Ñежимâ) Ð´Ð»Ñ Ð½Ð¸Ð·ÐºÐ¾ÑаÑÑоÑного диапазона и вÑÑокоÑаÑÑоÑного диапазона ÑооÑвеÑÑÑвенно. ÐапÑимеÑ, еÑли знаÑение Ð¿Ð¾Ð»Ñ âbsTttDualModeâ 901 Ñавно нÑлÑ, Ñо Ñогда иÑполÑзÑеÑÑÑ Ð¾Ð´Ð¸Ð½ Ñежим Ð´Ð»Ñ Ð²Ñего диапазона без ÑазлиÑÐ¸Ñ Ð¼ÐµÐ¶Ð´Ñ Ð½Ð¸Ð·ÐºÐ¾ÑаÑÑоÑнÑм диапазоном и вÑÑокоÑаÑÑоÑнÑм диапазоном. ÐÑли знаÑение Ð¿Ð¾Ð»Ñ âbsTttDualModeâ 901 Ñавно 1, Ñо Ñогда Ð´Ð»Ñ Ð½Ð¸Ð·ÐºÐ¾ÑаÑÑоÑного диапазона и вÑÑокоÑаÑÑоÑного диапазона могÑÑ Ð¸ÑполÑзоваÑÑÑÑ ÑазнÑе ÑежимÑ.The âbsTttDualModeâ 901 field indicates whether this TTT block works in different modes (hereinafter referred to as âdual modeâ) for the low-frequency range and high-frequency range, respectively. For example, if the value of the âbsTttDualModeâ 901 field is zero, then one mode is used for the entire range without a difference between the low-frequency range and the high-frequency range. If the value of the âbsTttDualModeâ 901 field is 1, then different modes can be used for the low-frequency range and high-frequency range.
Ðоле âbsTttModeLowâ 902 ÑказÑÐ²Ð°ÐµÑ ÑабоÑий Ñежим данного блока TTT, коÑоÑÑй Ð¼Ð¾Ð¶ÐµÑ Ð¸Ð¼ÐµÑÑ ÑазлиÑнÑе ÑабоÑие ÑежимÑ. ÐапÑимеÑ, блок TTT Ð¼Ð¾Ð¶ÐµÑ ÑабоÑаÑÑ Ð² Ñежиме пÑедÑказаниÑ, в коÑоÑом иÑполÑзÑÑÑÑÑ, напÑимеÑ, паÑамеÑÑÑ CPC и ICC, в Ñежиме на оÑнове оÑенки ÑнеÑгии, в коÑоÑом иÑполÑзÑÑÑÑÑ, напÑимеÑ, паÑамеÑÑÑ CLD, и Ñ.д. ÐÑли блок TTT Ð¸Ð¼ÐµÐµÑ Ð´ÑалÑнÑй Ñежим, Ñо Ð´Ð»Ñ Ð²ÑÑокоÑаÑÑоÑного диапазона Ð¼Ð¾Ð¶ÐµÑ Ð¿Ð¾ÑÑебоваÑÑÑÑ Ð´Ð¾Ð¿Ð¾Ð»Ð½Ð¸ÑелÑÐ½Ð°Ñ Ð¸Ð½ÑоÑмаÑиÑ.The âbsTttModeLowâ 902 field indicates the operating mode of this TTT block, which may have various operating modes. For example, the TTT block may operate in a prediction mode in which, for example, CPC and ICC parameters are used, in an energy estimation based mode in which, for example, CLD parameters are used, etc. If the TTT unit has dual mode, additional information may be required for the high frequency range.
Ðоле âbsTttModeHighâ 903 ÑказÑÐ²Ð°ÐµÑ ÑабоÑий Ñежим вÑÑокоÑаÑÑоÑного диапазона, и в ÑÑом ÑлÑÑае блок TTT Ð¸Ð¼ÐµÐµÑ Ð´ÑалÑнÑй Ñежим.The âbsTttModeHighâ field 903 indicates the operating mode of the high frequency range, in which case the TTT block has a dual mode.
Ðоле âbsTttBandsLowâ 904 ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° TTT.The âbsTttBandsLowâ field 904 indicates the number of parametric ranges used for the TTT block.
Ðоле âbsTttBandsHighâ 905 Ð¸Ð¼ÐµÐµÑ ânumBandsâ.Field âbsTttBandsHighâ 905 has ânumBandsâ.
ÐÑли блок TTT Ð¸Ð¼ÐµÐµÑ Ð´ÑалÑнÑй Ñежим, Ñо низкоÑаÑÑоÑнÑй диапазон Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð±Ð¾Ð»ÑÑим или ÑавнÑм нÑÐ»Ñ Ð¸ менÑÑим Ñем âbsTttBandsLowâ, в Ñо вÑÐµÐ¼Ñ ÐºÐ°Ðº вÑÑокоÑаÑÑоÑнÑй диапазон Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð±Ð¾Ð»ÑÑим или ÑавнÑм âbsTttBandsLowâ и менÑÑим Ñем âbsTttBandsHighâ.If the TTT block has dual mode, then the low frequency range can be greater than or equal to zero and smaller than âbsTttBandsLowâ, while the high frequency range can be greater than or equal to âbsTttBandsLowâ and smaller than âbsTttBandsHighâ.
ÐÑли блок TTT не Ð¸Ð¼ÐµÐµÑ Ð´ÑалÑнÑй Ñежим, Ñо колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° TTT, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð±Ð¾Ð»ÑÑе или Ñавно нÑÐ»Ñ Ð¸ менÑÑе ânumBandsâ (907).If the TTT block does not have dual mode, then the number of parametric ranges used for the TTT block may be greater than or equal to zero and less than ânumBandsâ (907).
Ðоле âbsTttBandsLowâ 904 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ÑикÑиÑованнÑм колиÑеÑÑвом биÑ. ÐапÑимеÑ, как показано на Ñиг. 9Ð, Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¿Ð¾Ð»Ñ âbsTttBandsLowâ 904 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²Ñделено 5 биÑ.The âbsTttBandsLowâ 904 field may be represented by a fixed number of bits. For example, as shown in FIG. 9A, 5 bits may be allocated to represent the âbsTttBandsLowâ 904 field.
Ðа Ñиг. 9Рпоказан ÑинÑакÑÐ¸Ñ Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° TTT, Ñ Ð¿ÐµÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. Фиг. 9РаналогиÑна Ñиг. 9Ð, но оÑлиÑаеÑÑÑ Ð¾Ñ Ñиг. 9Ð Ñем, ÑÑо поле âbsTttBandsLowâ 907 на Ñиг. 9РпÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом биÑ, в Ñо вÑÐµÐ¼Ñ ÐºÐ°Ðº поле âbsTttBandsLowâ 904 на Ñиг. 9РпÑедÑÑавлено ÑикÑиÑованнÑм колиÑеÑÑвом биÑ. Ð ÑаÑÑноÑÑи, поÑколÑÐºÑ Ð¿Ð¾Ð»Ðµ âbsTttBandsLowâ 907 Ð¸Ð¼ÐµÐµÑ Ð·Ð½Ð°Ñение, менÑÑее или Ñавное ânumBandsâ, поле âbsTttBandsâ 907 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ Ñ Ð¸ÑполÑзованием ânumBandsâ.In FIG. 9B shows a syntax for representing the number of parametric ranges used for a TTT block with a variable number of bits according to one embodiment of the present invention. FIG. 9B is similar to FIG. 9A, but different from FIG. 9A in that the âbsTttBandsLowâ 907 field in FIG. 9B is represented by a variable number of bits, while the âbsTttBandsLowâ 904 field in FIG. 9A is represented by a fixed number of bits. In particular, since the âbsTttBandsLowâ 907 field has a value less than or equal to ânumBandsâ, the âbsTttBandsâ 907 field can be represented by a variable number of bits using ânumBandsâ.
Ð ÑаÑÑноÑÑи, в ÑлÑÑае когда ânumBandsâ болÑÑе или Ñавно 2(n-1) и менÑÑе 2(n), поле âbsTttBandsLowâ 907 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено n биÑами.In particular, in the case where ânumBandsâ is greater than or equal to 2 (n-1) and less than 2 (n) , the field âbsTttBandsLowâ 907 may be represented by n bits.
ÐапÑимеÑ: (i) еÑли ânumBandsâ Ñавно 40, Ñо поле âbsTttBandsLowâ 907 пÑедÑÑавлÑеÑÑÑ 6 биÑами; (ii) еÑли ânumBandsâ Ñавно 28 или 20, Ñо поле âbsTttBandsLowâ 907 пÑедÑÑавлÑеÑÑÑ 5 биÑами; (iii) еÑли ânumBandsâ Ñавно 14 или 10, Ñо поле âbsTttBandsLowâ 907 пÑедÑÑавлÑеÑÑÑ 4 биÑами; и (iv) еÑли ânumBandsâ Ñавно 7, 5 или 4, Ñо поле âbsTttBandsLowâ пÑедÑÑавлÑеÑÑÑ 3 биÑами.For example: (i) if ânumBandsâ is 40, then the âbsTttBandsLowâ 907 field is represented by 6 bits; (ii) if ânumBandsâ is 28 or 20, then the field âbsTttBandsLowâ 907 is represented by 5 bits; (iii) if ânumBandsâ is 14 or 10, then the âbsTttBandsLowâ 907 field is represented by 4 bits; and (iv) if ânumBandsâ is 7, 5, or 4, then the âbsTttBandsLowâ field is represented by 3 bits.
ÐÑли ânumBandsâ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑ Ð² диапазоне, болÑÑем 2(n-1) и менÑÑим или ÑавнÑм 2(n), Ñо Ñогда поле âbsTttBandsLowâ 907 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено n биÑами.If ânumBandsâ is in a range greater than 2 (n-1) and less than or equal to 2 (n) , then the field âbsTttBandsLowâ 907 can be represented by n bits.
ÐапÑимеÑ: (i) еÑли ânumBandsâ Ñавно 40, Ñо поле âbsTttBandsLowâ 907 пÑедÑÑавлÑеÑÑÑ 6 биÑами; (ii) еÑли ânumBandsâ Ñавно 28 или 20, Ñо поле âbsTttBandsLowâ 907 пÑедÑÑавлÑеÑÑÑ 5 биÑами; (iii) еÑли ânumBandsâ Ñавно 14 или 10, Ñо поле âbsTttBandsLowâ 907 пÑедÑÑавлÑеÑÑÑ 4 биÑами; (iv) еÑли ânumBandsâ Ñавно 7 или 5, Ñо поле âbsTttBandsLowâ пÑедÑÑавлÑеÑÑÑ 3 биÑами; и (v) еÑли ânumBandsâ Ñавно 4, Ñо поле âbsTttBandsLowâ 907 пÑедÑÑавлÑеÑÑÑ 2 биÑами.For example: (i) if ânumBandsâ is 40, then the âbsTttBandsLowâ 907 field is represented by 6 bits; (ii) if ânumBandsâ is 28 or 20, then the field âbsTttBandsLowâ 907 is represented by 5 bits; (iii) if ânumBandsâ is 14 or 10, then the âbsTttBandsLowâ 907 field is represented by 4 bits; (iv) if ânumBandsâ is 7 or 5, then the âbsTttBandsLowâ field is represented by 3 bits; and (v) if ânumBandsâ is 4, then the âbsTttBandsLowâ 907 field is represented by 2 bits.
Ðоле âbsTttBandsLowâ 907 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено колиÑеÑÑвом биÑ, опÑеделÑемÑм ÑÑнкÑией наименÑÑего Ñелого, еÑли в каÑеÑÑве пеÑеменной пÑинÑÑÑ ânumBandsâ.The âbsTttBandsLowâ 907 field can be represented by the number of bits determined by the smallest integer function, if ânumBandsâ is taken as a variable.
ÐапÑимеÑ: i) в ÑлÑÑае когда 0 < bsTttBandsLow ⤠numBands или 0 ⤠bsTttBandsLow < numBands, поле âbsTttBandsLowâ 907 пÑедÑÑавлÑеÑÑÑ ÐºÐ¾Ð»Ð¸ÑеÑÑвом биÑ, ÑооÑвеÑÑÑвÑÑÑим знаÑÐµÐ½Ð¸Ñ ceil(log2(numBands)); или ii) в ÑлÑÑае когда 0 ⤠bsTttBandsLow ⤠numBands, поле âbsTttBandsLowâ 907 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ceil(log2(numBands+1)) биÑами.For example: i) in the case when 0 <bsTttBandsLow ⤠numBands or 0 ⤠bsTttBandsLow <numBands, the âbsTttBandsLowâ 907 field is represented by the number of bits corresponding to the value of ceil (log 2 (numBands)); or ii) in the case where 0 ⤠bsTttBandsLow ⤠numBands, the field âbsTttBandsLowâ 907 may be represented by ceil (log 2 (numBands + 1)) bits.
ÐÑли знаÑение, менÑÑее или Ñавное ânumBandsâ, Ñо еÑÑÑ ânumberBandsâ опÑеделено пÑоизволÑно, Ñо поле âbsTttBandsLowâ 907 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ Ñ Ð¸ÑполÑзованием ânumberBandsâ.If a value less than or equal to ânumBandsâ, that is, ânumberBandsâ is defined arbitrarily, then the field âbsTttBandsLowâ 907 can be represented by a variable number of bits using ânumberBandsâ.
Ð ÑаÑÑноÑÑи: i) в ÑлÑÑае когда 0 < bsTttBandsLow ⤠numberBands или 0 ⤠bsTttBandsLow < numberBands, поле âbsTttBandsLowâ 907 пÑедÑÑавлÑеÑÑÑ ÐºÐ¾Ð»Ð¸ÑеÑÑвом биÑ, ÑооÑвеÑÑÑвÑÑÑим знаÑÐµÐ½Ð¸Ñ ceil(log2(numberBands)); или ii) в ÑлÑÑае когда 0 ⤠bsTttBandsLow ⤠numberBands, поле âbsTttBandsLowâ 907 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено колиÑеÑÑвом биÑ, ÑооÑвеÑÑÑвÑÑÑим ceil(log2(numberBands +1)).In particular: i) in the case when 0 <bsTttBandsLow ⤠numberBands or 0 ⤠bsTttBandsLow <numberBands, the field âbsTttBandsLowâ 907 is represented by the number of bits corresponding to the value of ceil (log 2 (numberBands)); or ii) in the case where 0 ⤠bsTttBandsLow ⤠numberBands, the âbsTttBandsLowâ 907 field may be represented by the number of bits corresponding to ceil (log 2 (numberBands +1)).
Ð ÑлÑÑае множеÑÑва блоков TTT комбинаÑÐ¸Ñ Ð¸Ð· âbsTttBandsLowâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²ÑÑажена в виде ÑоÑмÑÐ»Ñ 5, опÑеделенной ниже.In the case of multiple TTT blocks, the combination of âbsTttBandsLowâ can be expressed as formula 5, defined below.
[ФоÑмÑла 5][Formula 5]
Ð ÑÑом ÑлÑÑае bsTttBandsLowi ÑказÑÐ²Ð°ÐµÑ i-й âbsTttBandsLowâ. ÐоÑколÑÐºÑ ÑоÑмÑла 5 иденÑиÑна ÑоÑмÑле 1, подÑобное обÑÑÑнение ÑоÑмÑÐ»Ñ 5 в далÑнейÑем опиÑании опÑÑено.In this case, bsTttBandsLow i indicates the ith âbsTttBandsLowâ. Since formula 5 is identical to formula 1, a detailed explanation of formula 5 is omitted in the following description.
Ð ÑлÑÑае множеÑÑва блоков TTT комбинаÑÐ¸Ñ Ð¸Ð· âbsTttBandsLowâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена одной из ÑоÑмÑл Ñ 6 по 8 Ñ Ð¸ÑполÑзованием ânumberBandsâ. ÐоÑколÑÐºÑ ÑоÑмÑÐ»Ñ Ñ 6 по 8 иденÑиÑÐ½Ñ ÑоÑмÑлам Ñ 2 по 4, подÑобное обÑÑÑнение ÑоÑмÑл Ñ 6 по 8 в поÑледÑÑÑем опиÑании опÑÑено.In the case of multiple TTT blocks, the combination of âbsTttBandsLowâ can be represented by one of formulas 6 through 8 using ânumberBandsâ. Since formulas 6 through 8 are identical to formulas 2 through 4, a detailed explanation of formulas 6 through 8 is omitted in the following description.
[ФоÑмÑла 6][Formula 6]
[ФоÑмÑла 7][Formula 7]
[ФоÑмÑла 8][Formula 8]
ÐолиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð¼Ð¾Ð´ÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² (напÑимеÑ, блок OTT и/или блок TTT), Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено в виде знаÑÐµÐ½Ð¸Ñ Ð´ÐµÐ»ÐµÐ½Ð¸Ñ ânumBandsâ. Ð ÑÑом ÑлÑÑае в каÑеÑÑве знаÑÐµÐ½Ð¸Ñ Ð´ÐµÐ»ÐµÐ½Ð¸Ñ Ð¸ÑполÑзÑÑÑ Ð¿Ð¾Ð»Ð¾Ð²Ð¸Ð½Ð½Ð¾Ðµ знаÑение ânumBandsâ или знаÑение, ÑвлÑÑÑееÑÑ ÑезÑлÑÑаÑом Ð´ÐµÐ»ÐµÐ½Ð¸Ñ ânumBandsâ на конкÑеÑное ÑиÑло.The number of parametric ranges used for the channel conversion module (for example, the OTT block and / or the TTT block) can be represented as the division value ânumBandsâ. In this case, the half value ânumBandsâ or the value resulting from dividing ânumBandsâ by a specific number is used as the division value.
Ðак ÑолÑко опÑеделено колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° OTT и/или TTT, могÑÑ Ð±ÑÑÑ Ð¾Ð¿ÑÐµÐ´ÐµÐ»ÐµÐ½Ñ Ð½Ð°Ð±Ð¾ÑÑ Ð¿Ð°ÑамеÑÑов, коÑоÑÑе можно пÑимениÑÑ Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ блока OTT и/или каждого блока TTT в ÑÐ°Ð¼ÐºÐ°Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð². ÐаждÑй из набоÑов паÑамеÑÑов Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿Ñименен Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ блока OTT и/или каждого блока TTT за вÑеменной инÑеÑвал, пÑинÑÑÑй за единиÑÑ Ð²Ñемени. Рименно, один Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿Ñименен к Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²ÑÐµÐ¼ÐµÐ½Ð½Ð¾Ð¼Ñ Ð¸Ð½ÑеÑвалÑ.Once the number of parametric ranges used for the OTT and / or TTT block is determined, parameter sets that can be applied to each OTT block and / or each TTT block within the number of parametric ranges can be determined. Each of the parameter sets can be applied for each OTT block and / or each TTT block for a time interval taken as a unit of time. Namely, one set of parameters can be applied to one time interval.
Ðак ÑпоминалоÑÑ Ð² пÑедÑдÑÑем опиÑании, один пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð¼Ð½Ð¾Ð¶ÐµÑÑво вÑеменнÑÑ Ð¸Ð½ÑеÑвалов. ÐÑли пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ Ð¾ÑноÑиÑÑÑ Ðº кадÑÑ ÑикÑиÑованного Ñипа, Ñогда Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿Ñименен Ð´Ð»Ñ Ð¼Ð½Ð¾Ð¶ÐµÑÑва вÑеменнÑÑ Ð¸Ð½ÑеÑвалов Ñавной длиÑелÑноÑÑи. ÐÑли ÐºÐ°Ð´Ñ Ð¾ÑноÑиÑÑÑ Ðº кадÑÑ Ð¿ÐµÑеменного Ñипа, Ñо Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾ имеÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов. ÐÑо подÑобно обÑÑÑнÑеÑÑÑ Ð½Ð¸Ð¶Ðµ Ñо ÑÑÑлками на ÑигÑÑÑ Ñ 13Рпо 13С.As mentioned in the previous description, one spatial frame may include multiple time slots. If the spatial frame refers to a frame of a fixed type, then a set of parameters can be applied for multiple time intervals of equal duration. If the frame refers to a frame of variable type, then it is necessary to have information about the position of the time interval for which a set of parameters is applied. This is explained in detail below with reference to figures 13A to 13C.
Ðа Ñиг. 10Рпоказан ÑинÑакÑÐ¸Ñ Ð´Ð»Ñ Ð¸Ð½ÑоÑмаÑии о конÑигÑÑаÑии Ñ Ð¿ÑоÑÑÑанÑÑвеннÑм ÑаÑÑиÑением Ð´Ð»Ñ ÐºÐ°Ð´Ñа пÑоÑÑÑанÑÑвенного ÑаÑÑиÑÐµÐ½Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. ÐнÑоÑмаÑÐ¸Ñ Ð¾ конÑигÑÑаÑии Ñ Ð¿ÑоÑÑÑанÑÑвеннÑм ÑаÑÑиÑением Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð¿Ð¾Ð»Ðµ âbsSacExtTypeâ 1001, поле âbsSacExtLenâ 1002, поле âbsSacExtLenAddâ 1003, поле âbsSacExtLenAddAddâ 1004 и поле âbsFillBitsâ 1007. ÐÐ¾Ð·Ð¼Ð¾Ð¶Ð½Ñ Ð¸ дÑÑгие полÑ.In FIG. 10A shows a syntax for spatial extension configuration information for a spatial extension frame according to one embodiment of the present invention. The spatial extension configuration information may include a âbsSacExtTypeâ field 1001, a âbsSacExtLenâ field 1002, a âbsSacExtLenAddâ field 1003, a âbsSacExtLenAddAddâ field 1004, and a âbsFillBitsâ field 1007. Other fields are possible.
Ðоле âbsSacExtTypeâ 1001 ÑказÑÐ²Ð°ÐµÑ Ñип даннÑÑ ÐºÐ°Ð´Ñа пÑоÑÑÑанÑÑвенного ÑаÑÑиÑениÑ. ÐапÑимеÑ, ÐºÐ°Ð´Ñ Ð¿ÑоÑÑÑанÑÑвенного ÑаÑÑиÑÐµÐ½Ð¸Ñ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð·Ð°Ð¿Ð¾Ð»Ð½ÐµÐ½ нÑлÑми, оÑÑаÑоÑнÑми даннÑми Ñигнала, пÑоизволÑнÑми оÑÑаÑоÑнÑми даннÑми Ñигнала поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸Ð»Ð¸ пÑоизволÑнÑми даннÑми о деÑеве.The âbsSacExtTypeâ field 1001 indicates the data type of the spatial extension frame. For example, a spatial expansion frame may be filled with zeros, residual signal data, arbitrary residual signal data after downmixing, or arbitrary tree data.
Ðоле âbsSacExtLenâ 1002 ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво Ð±Ð°Ð¹Ñ Ð¸Ð½ÑоÑмаÑии о конÑигÑÑаÑии Ñ Ð¿ÑоÑÑÑанÑÑвеннÑм ÑаÑÑиÑением.The âbsSacExtLenâ field 1002 indicates the number of bytes of spatial extension configuration information.
Ðоле âbsSacExtLenAddâ 1003 ÑказÑÐ²Ð°ÐµÑ Ð´Ð¾Ð¿Ð¾Ð»Ð½Ð¸ÑелÑное колиÑеÑÑво Ð±Ð°Ð¹Ñ Ð¸Ð½ÑоÑмаÑии о конÑигÑÑаÑии Ñ Ð¿ÑоÑÑÑанÑÑвеннÑм ÑаÑÑиÑением, еÑли колиÑеÑÑво Ð±Ð°Ð¹Ñ Ð¸Ð½ÑоÑмаÑии о конÑигÑÑаÑии Ñ Ð¿ÑоÑÑÑанÑÑвеннÑм ÑаÑÑиÑением ÑÑало болÑÑе или ÑавнÑм, напÑимеÑ, 15.The âbsSacExtLenAddâ field 1003 indicates an additional number of bytes of spatial extension configuration information if the number of bytes of spatial extension configuration information has become greater than or equal to, for example, 15.
Ðоле âbsSacExtLenAddAddâ 1004 ÑказÑÐ²Ð°ÐµÑ Ð´Ð¾Ð¿Ð¾Ð»Ð½Ð¸ÑелÑное колиÑеÑÑво Ð±Ð°Ð¹Ñ Ð¸Ð½ÑоÑмаÑии о конÑигÑÑаÑии Ñ Ð¿ÑоÑÑÑанÑÑвеннÑм ÑаÑÑиÑением, еÑли колиÑеÑÑво Ð±Ð°Ð¹Ñ Ð¸Ð½ÑоÑмаÑии о конÑигÑÑаÑии Ñ Ð¿ÑоÑÑÑанÑÑвеннÑм ÑаÑÑиÑением ÑÑало болÑÑе или Ñавно, напÑимеÑ, 270.The âbsSacExtLenAddAddâ field 1004 indicates an additional number of bytes of spatial extension configuration information if the number of bytes of spatial extension configuration information is greater than or equal to, for example, 270.
ÐоÑле опÑеделениÑ/вÑÐ´ÐµÐ»ÐµÐ½Ð¸Ñ Ð² кодеÑе/декодеÑе ÑооÑвеÑÑÑвÑÑÑÐ¸Ñ Ð¿Ð¾Ð»ÐµÐ¹ опÑеделÑеÑÑÑ (1005) инÑоÑмаÑÐ¸Ñ Ð¾ конÑигÑÑаÑии Ð´Ð»Ñ Ñипа даннÑÑ , вклÑÑÐµÐ½Ð½Ð°Ñ Ð² ÐºÐ°Ð´Ñ Ð¿ÑоÑÑÑанÑÑвенного ÑаÑÑиÑениÑ.After determining / highlighting the corresponding fields in the encoder / decoder (1005), configuration information for the data type included in the spatial extension frame is determined.
Ðак ÑпоминалоÑÑ Ð² пÑиведенном вÑÑе опиÑании, в кадÑе пÑоÑÑÑанÑÑвенного ÑаÑÑиÑÐµÐ½Ð¸Ñ Ð¼Ð¾Ð³ÑÑ ÑодеÑжаÑÑÑÑ Ð¾ÑÑаÑоÑнÑе даннÑе Ñигнала, пÑоизводнÑе оÑÑаÑоÑнÑе даннÑе Ñигнала поÑле понижаÑÑего микÑиÑованиÑ, даннÑе о конÑигÑÑаÑии деÑева или Ñ.п.As mentioned in the above description, the spatial extension frame may contain residual signal data, derivative residual signal data after downmixing, tree configuration data, or the like.
Ðалее вÑÑиÑлÑеÑÑÑ (1006) колиÑеÑÑво неиÑполÑзованнÑÑ Ð±Ð¸Ñ Ð¸ÑÑ Ð¾Ð´Ñ Ð¸Ð· Ð´Ð»Ð¸Ð½Ñ Ð¸Ð½ÑоÑмаÑии о конÑигÑÑаÑии Ñ Ð¿ÑоÑÑÑанÑÑвеннÑм ÑаÑÑиÑением.Next, the (1006) number of unused bits is calculated based on the length of the spatial extension configuration information.
Ðоле âbsFillBitsâ 1007 ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво Ð±Ð¸Ñ Ð´Ð°Ð½Ð½ÑÑ , коÑоÑÑе можно опÑÑÑиÑÑ Ð¿Ñи заполнении неиÑполÑзованнÑÑ Ð±Ð¸Ñ.The âbsFillBitsâ field 1007 indicates the number of data bits that can be omitted when filling in unused bits.
Ðа ÑигÑÑÐ°Ñ 10Ри 10С Ð¿Ð¾ÐºÐ°Ð·Ð°Ð½Ñ ÑинÑакÑиÑÑ Ð´Ð»Ñ Ð¸Ð½ÑоÑмаÑии о конÑигÑÑаÑии Ñ Ð¿ÑоÑÑÑанÑÑвеннÑм ÑаÑÑиÑением Ð´Ð»Ñ Ð¾ÑÑаÑоÑного Ñигнала в Ñом ÑлÑÑае, когда оÑÑаÑоÑнÑй Ñигнал вклÑÑен в ÐºÐ°Ð´Ñ Ð¿ÑоÑÑÑанÑÑвенного ÑаÑÑиÑениÑ, ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ.Figures 10B and 10C show syntaxes for spatial extension configuration information for a residual signal when the residual signal is included in the spatial extension frame, according to one embodiment of the present invention.
ÐбÑаÑимÑÑ Ðº Ñиг. 10Ð, где поле âbsResidualSamplingFrequencyIndexâ 1008 ÑказÑÐ²Ð°ÐµÑ ÑаÑÑоÑÑ Ð´Ð¸ÑкÑеÑизаÑии оÑÑаÑоÑного Ñигнала.Turning to FIG. 10B, where the âbsResidualSamplingFrequencyIndexâ field 1008 indicates the sampling frequency of the residual signal.
Ðоле âbsResidualFramesPerSpetialFrameâ 1009 ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво оÑÑаÑоÑнÑÑ ÐºÐ°Ð´Ñов на один пÑоÑÑÑанÑÑвеннÑй кадÑ. ÐапÑимеÑ, в одном пÑоÑÑÑанÑÑвенном кадÑе Ð¼Ð¾Ð¶ÐµÑ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑÑ 1, 2, 3 или 4 оÑÑаÑоÑнÑÑ ÐºÐ°Ð´Ñа.The âbsResidualFramesPerSpetialFrameâ field 1009 indicates the number of residual frames per spatial frame. For example, in one spatial frame there may be 1, 2, 3 or 4 residual frames.
Ðлок âResidualConfigâ 1010 ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð´Ð»Ñ Ð¾ÑÑаÑоÑного Ñигнала, пÑименÑемое Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ блока OTT и/или TTT.The âResidualConfigâ block 1010 indicates the number of parametric ranges for the residual signal applied for each OTT and / or TTT block.
ÐбÑаÑимÑÑ Ðº Ñиг. 10С, где поле âbsResidualPresentâ 1011 ÑказÑваеÑ, пÑименим ли оÑÑаÑоÑнÑй Ñигнал Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ блока OTT и/или TTT.Turning to FIG. 10C, where the âbsResidualPresentâ field 1011 indicates whether a residual signal is applicable for each OTT and / or TTT block.
Ðоле âbsResidualBandsâ 1012 ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² оÑÑаÑоÑного Ñигнала, ÑÑÑеÑÑвÑÑÑее в каждом блоке OTT и/или TTT, еÑли оÑÑаÑоÑнÑй Ñигнал ÑÑÑеÑÑвÑÐµÑ Ð² каждом блоке OTT и/или TTT. ÐолиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² оÑÑаÑоÑного Ñигнала Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ÑикÑиÑованнÑм колиÑеÑÑвом Ð±Ð¸Ñ Ð¸Ð»Ð¸ пеÑеменнÑм колиÑеÑÑвом биÑ. Ð ÑлÑÑае когда колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² пÑедÑÑавлено ÑикÑиÑованнÑм колиÑеÑÑвом биÑ, оÑÑаÑоÑнÑй Ñигнал Ð¼Ð¾Ð¶ÐµÑ Ð¸Ð¼ÐµÑÑ Ð·Ð½Ð°Ñение, менÑÑее или Ñавное обÑÐµÐ¼Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑÐ²Ñ Ð¿Ð°ÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² аÑдиоÑигнала. Так Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð²ÑÐµÑ Ð¿Ð°ÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²Ñделено Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾Ðµ колиÑеÑÑво Ð±Ð¸Ñ (напÑимеÑ, 5 Ð±Ð¸Ñ Ð½Ð° Ñиг. 10С).The âbsResidualBandsâ field 1012 indicates the number of parametric ranges of the residual signal existing in each OTT and / or TTT block, if a residual signal exists in each OTT and / or TTT block. The number of parametric ranges of the residual signal can be represented by a fixed number of bits or a variable number of bits. In the case where the number of parametric ranges is represented by a fixed number of bits, the residual signal may have a value less than or equal to the total number of parametric ranges of the audio signal. So, to represent all the parametric ranges, the necessary number of bits can be allocated (for example, 5 bits in Fig. 10C).
Ðа Ñиг. 10D показан ÑинÑакÑÐ¸Ñ Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² оÑÑаÑоÑного Ñигнала Ñ Ð¿Ð¾Ð¼Ð¾ÑÑÑ Ð¿ÐµÑеменного колиÑеÑÑва Ð±Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. Ðоле âbsResidualBandsâ 1014 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ Ñ Ð¸ÑполÑзованием ânumBandsâ. ÐÑли numBands болÑÑе или Ñавно 2(n-1) и менÑÑе 2(n), Ñо поле âbsResidualBandsâ 1014 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено n биÑами.In FIG. 10D shows a syntax for representing the number of parametric ranges of a residual signal using a variable number of bits according to one embodiment of the present invention. The âbsResidualBandsâ field 1014 may be represented by a variable number of bits using ânumBandsâ. If numBands is greater than or equal to 2 (n-1) and less than 2 (n) , then the âbsResidualBandsâ field 1014 may be represented by n bits.
ÐапÑимеÑ: (i) еÑли ânumBandsâ Ñавно 40, Ñо поле âbsResidualBandsâ 1014 пÑедÑÑавлÑеÑÑÑ 6 биÑами; (ii) еÑли ânumBandsâ Ñавно 28 или 20, Ñо поле âbsResidualBandsâ 1014 пÑедÑÑавлÑеÑÑÑ 5 биÑами; (iii) еÑли ânumBandsâ Ñавно 14 или 10, Ñо поле âbsResidualBandsâ 1014 пÑедÑÑавлÑеÑÑÑ 4 биÑами; (iv) еÑли ânumBandsâ Ñавно 7, 5 или 4, Ñо поле âbsResidualBandsâ 1014 пÑедÑÑавлÑеÑÑÑ 3 биÑами.For example: (i) if ânumBandsâ is 40, then the field âbsResidualBandsâ 1014 is represented by 6 bits; (ii) if ânumBandsâ is 28 or 20, then the field âbsResidualBandsâ 1014 is represented by 5 bits; (iii) if ânumBandsâ is 14 or 10, then the field âbsResidualBandsâ 1014 is represented by 4 bits; (iv) if ânumBandsâ is 7, 5 or 4, then the âbsResidualBandsâ 1014 field is represented by 3 bits.
ÐÑли numBands болÑÑе 2(n-1) и менÑÑе или Ñавно 2(n), Ñо колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² оÑÑаÑоÑного Ñигнала Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено n биÑами.If numBands is greater than 2 (n-1) and less than or equal to 2 (n) , then the number of parametric ranges of the residual signal can be represented by n bits.
ÐапÑимеÑ: (i) еÑли ânumBandsâ Ñавно 40, Ñо поле âbsResidualBandsâ 1014 пÑедÑÑавлÑеÑÑÑ 6 биÑами; (ii) еÑли ânumBandsâ Ñавно 28 или 20, Ñо поле âbsResidualBandsâ 1014 пÑедÑÑавлÑеÑÑÑ 5 биÑами; (iii) еÑли ânumBandsâ Ñавно 14 или 10, Ñо поле âbsResidualBandsâ 1014 пÑедÑÑавлÑеÑÑÑ 4 биÑами; (iv) еÑли ânumBandsâ Ñавно 7 или 5, Ñо поле âbsResidualBandsâ 1014 пÑедÑÑавлÑеÑÑÑ 3 биÑами; и (v) еÑли ânumBandsâ Ñавно 4, Ñо поле âbsResidualBandsâ 1014 пÑедÑÑавлÑеÑÑÑ 2 биÑами.For example: (i) if ânumBandsâ is 40, then the field âbsResidualBandsâ 1014 is represented by 6 bits; (ii) if ânumBandsâ is 28 or 20, then the field âbsResidualBandsâ 1014 is represented by 5 bits; (iii) if ânumBandsâ is 14 or 10, then the field âbsResidualBandsâ 1014 is represented by 4 bits; (iv) if ânumBandsâ is 7 or 5, then the field âbsResidualBandsâ 1014 is represented by 3 bits; and (v) if ânumBandsâ is 4, then the âbsResidualBandsâ 1014 field is represented by 2 bits.
ÐÑоме Ñого, поле âbsResidualBandsâ 1014 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено колиÑеÑÑвом биÑ, опÑеделÑемÑм ÑÑнкÑией окÑÑÐ³Ð»ÐµÐ½Ð¸Ñ Ð´Ð¾ ближайÑего Ñелого, еÑли в каÑеÑÑве пеÑеменной пÑинÑÑÑ ânumBandsâ.In addition, the âbsResidualBandsâ field 1014 can be represented by the number of bits determined by the rounding function to the nearest integer if ânumBandsâ is taken as a variable.
Ð ÑаÑÑноÑÑи: i) в ÑлÑÑае когда 0 < bsResidualBands ⤠numBands или 0 ⤠bsResidualBands < numBands, поле âbsResidualBandsâ 1014 пÑедÑÑавлÑеÑÑÑ ceil(log2(numBands)) биÑами; или ii) в ÑлÑÑае когда 0 ⤠bsResidualBands ⤠numBands, поле âbsResidualBandsâ 1014 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ceil(log2(numBands+1)) биÑами.In particular: i) in the case when 0 <bsResidualBands ⤠numBands or 0 ⤠bsResidualBands <numBands, the field âbsResidualBandsâ 1014 is represented by ceil (log 2 (numBands)) bits; or ii) in the case where 0 ⤠bsResidualBands ⤠numBands, the field âbsResidualBandsâ 1014 may be represented by ceil (log 2 (numBands + 1)) bits.
РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð¿Ð¾Ð»Ðµ âbsResidualBandsâ 1014 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено Ñ Ð¸ÑполÑзованием знаÑÐµÐ½Ð¸Ñ (numberBands), менÑÑего или Ñавного numBands.In some embodiments, the âbsResidualBandsâ field 1014 may be represented using a value (numberBands) less than or equal to numBands.
Ð ÑаÑÑноÑÑи: i) в ÑлÑÑае когда 0 < bsResidualBands ⤠numberBands или 0 ⤠bsResidualBands < numberBands, поле âbsResidualBandsâ 1014 пÑедÑÑавлÑеÑÑÑ ceil(log2(numberBands)) биÑами; или ii) в ÑлÑÑае когда 0 ⤠bsResidualBands ⤠numberBands, поле âbsResidualBandsâ 1014 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ceil(log2(numberBands +1)) биÑами.In particular: i) in the case when 0 <bsResidualBands ⤠numberBands or 0 ⤠bsResidualBands <numberBands, the field âbsResidualBandsâ 1014 is represented by ceil (log 2 (numberBands)) bits; or ii) in the case where 0 ⤠bsResidualBands ⤠numberBands, the âbsResidualBandsâ 1014 field may be represented by ceil (log 2 (numberBands +1)) bits.
Ð ÑлÑÑае налиÑÐ¸Ñ Ð¼Ð½Ð¾Ð¶ÐµÑÑва оÑÑаÑоÑнÑÑ Ñигналов (N) комбинаÑÐ¸Ñ Ð¸Ð· âbsResidualBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²ÑÑажена в виде ÑоÑмÑÐ»Ñ 9, опÑеделенной ниже.In the case of a plurality of residual signals (N), the combination of âbsResidualBandsâ can be expressed as formula 9, defined below.
[ФоÑмÑла 9][Formula 9]
Ð ÑÑом ÑлÑÑае bsResidualBandsi ÑказÑÐ²Ð°ÐµÑ i-й âbsResidualBandsâ. ÐоÑколÑÐºÑ ÑоÑмÑла 9 иденÑиÑна ÑоÑмÑле 1, подÑобное обÑÑÑнение ÑоÑмÑÐ»Ñ 9 в далÑнейÑем опиÑании опÑÑено.In this case, bsResidualBands i indicates the ith âbsResidualBandsâ. Since formula 9 is identical to formula 1, a detailed explanation of formula 9 is omitted in the following description.
Ð ÑлÑÑае множеÑÑва оÑÑаÑоÑнÑÑ Ñигналов комбинаÑÐ¸Ñ Ð¸Ð· âbsResidualBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена одной из ÑоÑмÑл Ñ 10 по 12 Ñ Ð¸ÑполÑзованием ânumberBandsâ. ÐоÑколÑÐºÑ Ð¿ÑедÑÑавление âbsResidualBandsâ Ñ Ð¸ÑполÑзованием ânumberBandsâ иденÑиÑно пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÑоÑмÑл Ñ 2 по 4, Ð¸Ñ Ð¿Ð¾Ð´Ñобное обÑÑÑнение в поÑледÑÑÑем опиÑании опÑÑено.In the case of multiple residual signals, the combination of âbsResidualBandsâ can be represented by one of the formulas 10 to 12 using ânumberBandsâ. Since the representation of âbsResidualBandsâ using ânumberBandsâ is identical to the representation of formulas 2 through 4, their detailed explanation is omitted in the following description.
[ФоÑмÑла 10][Formula 10]
[ФоÑмÑла 11][Formula 11]
[ФоÑмÑла 12][Formula 12]
ÐолиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² оÑÑаÑоÑного Ñигнала Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено в виде знаÑÐµÐ½Ð¸Ñ Ð´ÐµÐ»ÐµÐ½Ð¸Ñ ânumBandsâ. Ð ÑÑом ÑлÑÑае Ð´Ð»Ñ Ð·Ð½Ð°ÑÐµÐ½Ð¸Ñ Ð´ÐµÐ»ÐµÐ½Ð¸Ñ Ð¼Ð¾Ð¶Ð½Ð¾ иÑполÑзоваÑÑ Ð¿Ð¾Ð»Ð¾Ð²Ð¸Ð½Ð½Ð¾Ðµ знаÑение ânumBandsâ или знаÑение, ÑвлÑÑÑееÑÑ ÑезÑлÑÑаÑом Ð´ÐµÐ»ÐµÐ½Ð¸Ñ ânumBandsâ на конкÑеÑное знаÑение.The number of parametric ranges of the residual signal can be represented as the division value ânumBandsâ. In this case, you can use the half value ânumBandsâ or the value that results from dividing ânumBandsâ by a specific value for the division value.
ÐÑÑаÑоÑнÑй Ñигнал Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²ÐºÐ»ÑÑен в биÑовÑй поÑок аÑдиоÑигнала вмеÑÑе Ñ Ñигналом поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ пÑоÑÑÑанÑÑвеннÑм инÑоÑмаÑионнÑм Ñигналом, и ÑÑÐ¾Ñ Ð±Ð¸ÑовÑй поÑок Ð¼Ð¾Ð¶ÐµÑ Ð¿ÐµÑеÑÑлаÑÑÑÑ Ð² декодеÑ. ÐÐµÐºÐ¾Ð´ÐµÑ Ð¼Ð¾Ð¶ÐµÑ Ð²ÑделÑÑÑ Ð¸Ð· биÑового поÑока Ñигнал поÑле понижаÑÑего микÑиÑованиÑ, пÑоÑÑÑанÑÑвеннÑй инÑоÑмаÑионнÑй Ñигнал и оÑÑаÑоÑнÑй Ñигнал.The residual signal may be included in the bitstream of the audio signal along with the downmix signal and the spatial information signal, and this bitstream may be sent to the decoder. The decoder can extract from the bitstream the signal after down-mixing, the spatial information signal and the residual signal.
Ðалее Ñигнал, полÑÑеннÑй в ÑезÑлÑÑаÑе понижаÑÑего микÑиÑованиÑ, подвеÑгаеÑÑÑ Ð¿Ð¾Ð²ÑÑаÑÑÐµÐ¼Ñ Ð¼Ð¸ÐºÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ñ Ð¸ÑполÑзованием пÑоÑÑÑанÑÑвенной инÑоÑмаÑии. ÐÐµÐ¶Ð´Ñ Ñем, в Ñ Ð¾Ð´Ðµ повÑÑаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ðº ÑÐ¸Ð³Ð½Ð°Ð»Ñ Ð¿Ð¾Ð½Ð¸Ð¶Ð°ÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿ÑилагаеÑÑÑ Ð¾ÑÑаÑоÑнÑй Ñигнал. Ð ÑаÑÑноÑÑи, Ñигнал, полÑÑеннÑй в ÑезÑлÑÑаÑе понижаÑÑего микÑиÑованиÑ, подвеÑгаеÑÑÑ Ð¿Ð¾Ð²ÑÑаÑÑÐµÐ¼Ñ Ð¼Ð¸ÐºÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð²Ð¾ множеÑÑве модÑлей пÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² Ñ Ð¸ÑполÑзованием пÑоÑÑÑанÑÑвенной инÑоÑмаÑии. ÐÑи вÑполнении ÑÑого в модÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² подаеÑÑÑ Ð¾ÑÑаÑоÑнÑй Ñигнал. Ðак ÑпоминалоÑÑ Ð² пÑедÑеÑÑвÑÑÑем опиÑании, модÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² Ð¸Ð¼ÐµÐµÑ Ð½ÐµÑколÑко паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², и в модÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² подаеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ вÑеменного инÑеÑвала. Ðогда оÑÑаÑоÑнÑй Ñигнал подаеÑÑÑ Ð² модÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð², возможно, понадобиÑÑÑ, ÑÑÐ¾Ð±Ñ Ð¾ÑÑаÑоÑнÑй Ñигнал обновил инÑоÑмаÑÐ¸Ñ Ð¾ межканалÑной коÑÑелÑÑии аÑдиоÑигнала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð¾ÑÑаÑоÑнÑй Ñигнал. ÐаÑем Ð¾Ð±Ð½Ð¾Ð²Ð»ÐµÐ½Ð½Ð°Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ межканалÑной коÑÑелÑÑии иÑполÑзÑеÑÑÑ Ð² пÑоÑеÑÑе повÑÑаÑÑего микÑиÑованиÑ.Further, the signal resulting from the downmix is subjected to upmix using spatial information. Meanwhile, during the upmix, a residual signal is applied to the downmix signal. In particular, the signal resulting from the downmix is upmixed in a plurality of channel conversion modules using spatial information. When doing this, a residual signal is supplied to the channel conversion module. As mentioned in the previous description, the channel conversion module has several parametric ranges, and a set of parameters for each time interval is supplied to the channel conversion module. When the residual signal is supplied to the channel conversion module, it may be necessary for the residual signal to update the inter-channel correlation information of the audio signal for which the residual signal is applied. The updated cross-channel correlation information is then used in the upmix process.
Ðа Ñиг. 11РпÑедÑÑавлена блок-ÑÑ ÐµÐ¼Ð° декодеÑа Ð´Ð»Ñ Ð½ÐµÑпÑавлÑемого кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. ÐеÑпÑавлÑемое кодиÑование ознаÑаеÑ, ÑÑо пÑоÑÑÑанÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð½Ðµ вклÑÑена в биÑовÑй поÑок аÑдиоÑигнала.In FIG. 11A is a block diagram of a decoder for unmanaged coding according to one embodiment of the present invention. Uncontrolled coding means that spatial information is not included in the bitstream of the audio signal.
РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð´ÐµÐºÐ¾Ð´ÐµÑ Ð²ÐºÐ»ÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð³ÑÐµÐ±ÐµÐ½ÐºÑ 1102 ÑилÑÑÑов Ð´Ð»Ñ Ð°Ð½Ð°Ð»Ð¸Ð·Ð°, блок 1104 анализа, блок 1106 пÑоÑÑÑанÑÑвенного ÑинÑеза и гÑÐµÐ±ÐµÐ½ÐºÑ 1108 ÑилÑÑÑов Ð´Ð»Ñ ÑинÑеза. ХоÑÑ Ð½Ð° Ñиг. 11Рпоказан Ñигнал поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð² Ñигнале Ñипа âÑÑеÑеоâ, можно иÑполÑзоваÑÑ Ð¸ дÑÑгие ÑÐ¸Ð¿Ñ Ñигналов поÑле понижаÑÑего микÑиÑованиÑ.In some embodiments, the decoder includes an analysis filter bank 1102, an analysis unit 1104, a spatial synthesis unit 1106, and a synthesis filter bank 1108. Although in FIG. 11A shows a signal after down-mixing in a stereo signal, other types of signals after down-mixing can be used.
РпÑоÑеÑÑе ÑÑнкÑиониÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð´ÐµÐºÐ¾Ð´ÐµÑ Ð¿ÑÐ¸Ð½Ð¸Ð¼Ð°ÐµÑ Ñигнал 1101 поÑле понижаÑÑего микÑиÑованиÑ, а гÑебенка 1102 ÑилÑÑÑов Ð´Ð»Ñ Ð°Ð½Ð°Ð»Ð¸Ð·Ð° пÑеобÑазÑÐµÑ Ð¿Ð¾Ð»ÑÑеннÑй Ñигнал 1101 поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð² Ñигнал 1103 ÑаÑÑоÑной облаÑÑи. Ðлок 1104 анализа ÑÐ¾Ð·Ð´Ð°ÐµÑ Ð¿ÑоÑÑÑанÑÑвеннÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð½Ð° оÑнове пÑеобÑазованного Ñигнала 1103 поÑле понижаÑÑего микÑиÑованиÑ. Ðлок 1104 анализа вÑполнÑÐµÑ Ð¾Ð±ÑабоÑÐºÑ Ð¿Ð¾ ÐºÐ°Ð¶Ð´Ð¾Ð¼Ñ Ð²ÑÐµÐ¼ÐµÐ½Ð½Ð¾Ð¼Ñ Ð¸Ð½ÑеÑвалÑ, а пÑоÑÑÑанÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ 1105 Ð¼Ð¾Ð¶ÐµÑ ÑоздаваÑÑÑÑ Ð´Ð»Ñ Ð¼Ð½Ð¾Ð¶ÐµÑÑва вÑеменнÑÑ Ð¸Ð½ÑеÑвалов. Ð ÑÑом ÑлÑÑае вÑеменной инÑеÑвал вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¾Ð´Ð¸Ð½ вÑеменной инÑеÑвал.During operation, the decoder receives the signal 1101 after the down-mix, and the filter bank 1102 for analysis converts the received signal 1101 after the down-mix to a frequency- domain signal 1103. An analysis unit 1104 creates spatial information based on the transformed signal 1103 after down-mixing. An analysis unit 1104 performs processing for each time interval, and spatial information 1105 may be generated for a plurality of time intervals. In this case, the time interval includes one time interval.
ÐÑоÑÑÑанÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ñоздана в два ÑÑапа. Ðо-пеÑвÑÑ , из Ñигнала поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑоздаеÑÑÑ Ð¿Ð°ÑамеÑÑ Ð¿Ð¾Ð½Ð¸Ð¶Ð°ÑÑего микÑиÑованиÑ. Ðо-вÑоÑÑÑ , паÑамеÑÑ Ð¿Ð¾Ð½Ð¸Ð¶Ð°ÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿ÑеобÑазÑеÑÑÑ Ð² пÑоÑÑÑанÑÑвеннÑÑ Ð¸Ð½ÑоÑмаÑиÑ, напÑÐ¸Ð¼ÐµÑ Ð¿ÑоÑÑÑанÑÑвеннÑй паÑамеÑÑ. РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð¿Ð°ÑамеÑÑ Ð¿Ð¾Ð½Ð¸Ð¶Ð°ÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ñоздан поÑÑедÑÑвом маÑÑиÑнÑÑ Ð²ÑÑиÑлений Ñигнала поÑле понижаÑÑего микÑиÑованиÑ.Spatial information can be created in two stages. Firstly, a down-mix parameter is created from the signal after down-mixing. Secondly, the downmix parameter is converted to spatial information, such as a spatial parameter. In some embodiments, the downmix parameter can be created by matrix calculations of the signal after downmix.
Ðлок 1106 пÑоÑÑÑанÑÑвенного ÑинÑеза ÑÐ¾Ð·Ð´Ð°ÐµÑ Ð¼Ð½Ð¾Ð³Ð¾ÐºÐ°Ð½Ð°Ð»ÑнÑй аÑдиоÑигнал 1107 пÑÑем ÑинÑеза Ñозданной пÑоÑÑÑанÑÑвенной инÑоÑмаÑии 1105 Ñ Ñигналом 1103 понижаÑÑего микÑиÑованиÑ. СозданнÑй многоканалÑнÑй аÑдиоÑигнал 1107 пÑÐ¾Ñ Ð¾Ð´Ð¸Ñ ÑеÑез гÑÐµÐ±ÐµÐ½ÐºÑ 1108 ÑилÑÑÑов Ð´Ð»Ñ ÑинÑеза Ñ ÑелÑÑ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ Ð² аÑдиоÑигнал 1109 во вÑеменной облаÑÑи.The spatial synthesis unit 1106 creates a multi-channel audio signal 1107 by synthesizing the generated spatial information 1105 with a downmix signal 1103. The created multi-channel audio signal 1107 passes through a filter bank 1108 for synthesis to be converted to an audio signal 1109 in the time domain.
ÐÑоÑÑÑанÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¼Ð¾Ð¶ÐµÑ ÑоздаваÑÑÑÑ Ñ Ð·Ð°Ñанее опÑеделеннÑÑ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ð¹ вÑеменнÑÑ Ð¸Ð½ÑеÑвалов. РаÑÑÑоÑÐ½Ð¸Ñ Ð¼ÐµÐ¶Ð´Ñ ÑÑими положениÑми могÑÑ Ð±ÑÑÑ ÑавнÑми (Ñо еÑÑÑ ÑквидиÑÑанÑнÑе). ÐапÑимеÑ, пÑоÑÑÑанÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¼Ð¾Ð¶ÐµÑ ÑоздаваÑÑÑÑ Ð½Ð° 4 вÑеменнÑÑ Ð¸Ð½ÑеÑвала. ÐÑоÑÑÑанÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¼Ð¾Ð¶ÐµÑ Ñакже ÑоздаваÑÑÑÑ Ñ Ð¿ÐµÑеменнÑÑ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ð¹ вÑеменнÑÑ Ð¸Ð½ÑеÑвалов. Ð ÑÑом ÑлÑÑае инÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменного инÑеÑвала, Ñ ÐºÐ¾ÑоÑого ÑоздаеÑÑÑ Ð¿ÑоÑÑÑанÑÑÐ²ÐµÐ½Ð½Ð°Ñ Ð¸Ð½ÑоÑмаÑиÑ, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¸Ð·Ð²Ð»ÐµÑена из биÑового поÑока. ÐнÑоÑмаÑÐ¸Ñ Ð¾ положении Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена пеÑеменнÑм колиÑеÑÑвом биÑ. ÐнÑоÑмаÑÐ¸Ñ Ð¾ положении Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена в виде абÑолÑÑного знаÑÐµÐ½Ð¸Ñ Ð¸ знаÑÐµÐ½Ð¸Ñ ÑазноÑÑи оÑноÑиÑелÑно пÑедÑдÑÑей инÑоÑмаÑии о положении вÑеменного инÑеÑвала.Spatial information can be created from predefined positions of time intervals. Distances between these positions may be equal (i.e. equidistant). For example, spatial information can be created over 4 time slots. Spatial information can also be created from the variable positions of time intervals. In this case, information about the position of the time interval from which the spatial information is generated can be extracted from the bitstream. The position information may be represented by a variable number of bits. Information about the position can be presented in the form of an absolute value and a difference value relative to previous information about the position of the time interval.
Ð ÑлÑÑае иÑполÑÐ·Ð¾Ð²Ð°Ð½Ð¸Ñ Ð½ÐµÑпÑавлÑемого кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² (далее назÑваемое âbsNumguidedBlindBandsâ) Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ канала аÑдиоÑигнала Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ÑикÑиÑованнÑм колиÑеÑÑвом биÑ. âbsNumguidedBlindBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ Ñ Ð¸ÑполÑзованием ânumBandsâ. ÐапÑимеÑ, еÑли ânumBandsâ болÑÑе или Ñавно 2(n-1) и менÑÑе 2(n), Ñо âbsNumguidedBlindBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом n биÑ.In the case of uncontrolled coding, the number of parametric ranges (hereinafter referred to as âbsNumguidedBlindBandsâ) for each channel of the audio signal can be represented by a fixed number of bits. âBsNumguidedBlindBandsâ can be represented by a variable number of bits using ânumBandsâ. For example, if ânumBandsâ is greater than or equal to 2 (n-1) and less than 2 (n) , then âbsNumguidedBlindBandsâ can be represented by a variable number of n bits.
Ð ÑаÑÑноÑÑи, (а) еÑли ânumBandsâ Ñавно 40, Ñо âbsNumguidedBlindBandsâ пÑедÑÑавлÑеÑÑÑ 6 биÑами, (b) еÑли ânumBandsâ Ñавно 28 или 20, Ñо âbsNumguidedBlindBandsâ пÑедÑÑавлÑеÑÑÑ 5 биÑами, (Ñ) еÑли ânumBandsâ Ñавно 14 или 10, Ñо âbsNumguidedBlindBandsâ пÑедÑÑавлÑеÑÑÑ 4 биÑами, и (d) еÑли ânumBandsâ Ñавно 7, 5 или 4, Ñо âbsNumguidedBlindBandsâ пÑедÑÑавлÑеÑÑÑ 3 биÑами.In particular, (a) if ânumBandsâ is 40, then âbsNumguidedBlindBandsâ is represented by 6 bits, (b) if ânumBandsâ is equal to 28 or 20, then âbsNumguidedBlindBandsâ is represented by 5 bits, (c) if ânumBandsâ is 14 or 10, then âbsNumguidedBlindBandsâ is represented by 4 bits, and (d) if ânumBandsâ is 7, 5 or 4, then âbsNumguidedBlindBandsâ is represented by 3 bits.
ÐÑли ânumBandsâ болÑÑе 2(n-1) и менÑÑе или Ñавно 2(n), Ñо Ñогда âbsNumguidedBlindBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом n биÑ.If ânumBandsâ is greater than 2 (n-1) and less than or equal to 2 (n) , then âbsNumguidedBlindBandsâ can be represented by a variable number of n bits.
ÐапÑимеÑ: (а) еÑли ânumBandsâ Ñавно 40, Ñо âbsNumguidedBlindBandsâ пÑедÑÑавлÑеÑÑÑ 6 биÑами, (b) еÑли ânumBandsâ Ñавно 28 или 20, Ñо âbsNumguidedBlindBandsâ пÑедÑÑавлÑеÑÑÑ 5 биÑами, (Ñ) еÑли ânumBandsâ Ñавно 14 или 10, Ñо âbsNumguidedBlindBandsâ пÑедÑÑавлÑеÑÑÑ 4 биÑами, (d) еÑли ânumBandsâ Ñавно 7 или 5, Ñо âbsNumguidedBlindBandsâ пÑедÑÑавлÑеÑÑÑ 3 биÑами; и (e) еÑли ânumBandsâ Ñавно 4, Ñо âbsNumguidedBlindBandsâ пÑедÑÑавлÑеÑÑÑ 2 биÑами.For example: (a) if ânumBandsâ is 40, then âbsNumguidedBlindBandsâ is represented by 6 bits, (b) if ânumBandsâ is equal to 28 or 20, then âbsNumguidedBlindBandsâ is represented by 5 bits, (c) if ânumBandsâ is 14 or 10, then âbsNumguidedBlindBandsâ is represented by 4 bits, (d) if ânumBandsâ is 7 or 5, then âbsNumguidedBlindBandsâ is represented by 3 bits; and (e) if ânumBandsâ is 4, then âbsNumguidedBlindBandsâ is represented by 2 bits.
ÐÑоме Ñого, âbsNumguidedBlindBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ Ñ Ð¸ÑполÑзованием ÑÑнкÑии минималÑного Ñелого, еÑли в каÑеÑÑве пеÑеменной пÑинÑÑÑ ânumBandsâ.In addition, âbsNumguidedBlindBandsâ can be represented by a variable number of bits using the minimum integer function, if ânumBandsâ is taken as a variable.
ÐапÑимеÑ, i) в ÑлÑÑае еÑли 0 < bsNumguidedBlindBands ⤠numBands или 0 ⤠bsNumguidedBlindBands < numBands, Ñо âbsNumguidedBlindBandsâ пÑедÑÑавлÑеÑÑÑ ceil(log2(numBands)) биÑами; или ii) в ÑлÑÑае когда 0 ⤠bsNumguidedBlindBands ⤠numBands, Ñо âbsNumguidedBlindBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ceil(log2(numBands+1)) биÑами.For example, i) if 0 <bsNumguidedBlindBands ⤠numBands or 0 ⤠bsNumguidedBlindBands <numBands, then âbsNumguidedBlindBandsâ is represented by ceil (log 2 (numBands)) bits; or ii) in the case where 0 ⤠bsNumguidedBlindBands ⤠numBands, then âbsNumguidedBlindBandsâ may be represented by ceil (log 2 (numBands + 1)) bits.
ÐÑли знаÑение менÑÑе или Ñавно ânumBandsâ, Ñо еÑÑÑ ânumberBandsâ опÑеделено пÑоизволÑно, Ñо âbsNumguidedBlindBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ÑледÑÑÑим обÑазом.If the value is less than or equal to ânumBandsâ, that is, ânumberBandsâ is defined arbitrarily, then âbsNumguidedBlindBandsâ can be represented as follows.
Ð ÑаÑÑноÑÑи, i) в ÑлÑÑае еÑли 0 < bsNumguidedBlindBands ⤠numberBands или 0 ⤠bsNumguidedBlindBands < numberBands, Ñо âbsNumguidedBlindBandsâ пÑедÑÑавлÑеÑÑÑ ceil(log2(numberBands)) биÑами; или ii) в ÑлÑÑае когда 0 ⤠bsNumguidedBlindBands ⤠numberBands, Ñо âbsNumguidedBlindBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено ceil(log2(numberBands+1)) биÑами.In particular, i) if 0 <bsNumguidedBlindBands ⤠numberBands or 0 ⤠bsNumguidedBlindBands <numberBands, then âbsNumguidedBlindBandsâ is represented by ceil (log 2 (numberBands)) bits; or ii) in the case where 0 ⤠bsNumguidedBlindBands ⤠numberBands, then âbsNumguidedBlindBandsâ may be represented by ceil (log 2 (numberBands + 1)) bits.
ÐÑли ÑÑÑеÑÑвÑÐµÑ N каналов, Ñо комбинаÑÐ¸Ñ âbsNumguidedBlindBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²ÑÑажена в виде ÑоÑмÑÐ»Ñ 13.If there are N channels, then the combination âbsNumguidedBlindBandsâ can be expressed as formula 13.
[ФоÑмÑла 13][Formula 13]
Ð ÑÑом ÑлÑÑае bsNumguidedBlindBandsi ÑказÑÐ²Ð°ÐµÑ i-е âbsNumguidedBlindBandsâ. ÐоÑколÑÐºÑ ÑоÑмÑла 13 иденÑиÑна ÑоÑмÑле 1, подÑобное обÑÑÑнение ÑоÑмÑÐ»Ñ 13 в поÑледÑÑÑем опиÑании опÑÑено. ÐÑли имееÑÑÑ Ð¼Ð½Ð¾Ð¶ÐµÑÑво каналов, Ñо âbsNumguidedBlindBandsâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено одной из ÑоÑмÑл Ñ 14 по 16 Ñ Ð¸ÑполÑзованием ânumberBandsâ. ÐоÑколÑÐºÑ Ð¿ÑеÑÑавление âbsNumguidedBlindBandsâ Ñ Ð¸ÑполÑзованием ânumberBandsâ иденÑиÑно пÑедÑÑавлениÑм в ÑоÑмÑÐ»Ð°Ñ Ñ 2 по 4, подÑобное обÑÑÑнение ÑоÑмÑл Ñ 14 по 16 в поÑледÑÑÑем опиÑании опÑÑено.In this case, bsNumguidedBlindBands i indicates the ith âbsNumguidedBlindBandsâ. Since formula 13 is identical to formula 1, a detailed explanation of formula 13 is omitted in the following description. If there are multiple channels, then âbsNumguidedBlindBandsâ can be represented by one of the formulas 14 through 16 using ânumberBandsâ. Since the representation of âbsNumguidedBlindBandsâ using ânumberBandsâ is identical to the representations in formulas 2 through 4, a detailed explanation of formulas 14 through 16 is omitted in the following description.
[ФоÑмÑла 14][Formula 14]
[ФоÑмÑла 15][Formula 15]
[ФоÑмÑла 16][Formula 16]
Ðа Ñиг. 11РпÑедÑÑавлена ÑÑ ÐµÐ¼Ð° Ð´Ð»Ñ ÑпоÑоба пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² в виде гÑÑÐ¿Ð¿Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. ÐолиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð¼Ð¾Ð´ÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð², инÑоÑмаÑÐ¸Ñ Ð¾ колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð¾ÑÑаÑоÑного Ñигнала, и инÑоÑмаÑÐ¸Ñ Ð¾ колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ канала аÑдиоÑигнала в ÑлÑÑае иÑполÑÐ·Ð¾Ð²Ð°Ð½Ð¸Ñ Ð½ÐµÑпÑавлÑемого кодиÑованиÑ. Ð ÑлÑÑае когда ÑÑÑеÑÑвÑÐµÑ Ð¼Ð½Ð¾Ð¶ÐµÑÑво инÑоÑмаÑий о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², множеÑÑво инÑоÑмаÑий о колиÑеÑÑве (напÑимеÑ, âbsOttbandsâ, âbsTttbandsâ, âbsResidualBandâ и/или âbsNumguidedBlindBandsâ) Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено по менÑÑей меÑе в виде одной или неÑколÑÐºÐ¸Ñ Ð³ÑÑпп.In FIG. 11B is a diagram for a method for representing the number of parametric ranges as a group according to one embodiment of the present invention. The number of parametric ranges includes information on the number of parametric ranges used for the channel conversion module, information on the number of parametric ranges used for the residual signal, and information on the number of parametric ranges for each channel of the audio signal in the case of uncontrolled coding. In the case where there is a lot of information about the number of parametric ranges, a lot of information about the quantity (for example, âbsOttbandsâ, âbsTttbandsâ, âbsResidualBandâ and / or âbsNumguidedBlindBandsâ) can be presented in at least one or more groups.
ÐбÑаÑимÑÑ Ðº Ñиг. 11Ð, где еÑли имееÑÑÑ (kN+L) инÑоÑмаÑий о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² и еÑли Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹ инÑоÑмаÑии о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾ Q биÑ, Ñо множеÑÑво даннÑÑ Ð¾ колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено в виде ÑледÑÑÑей гÑÑппÑ. Ð ÑÑом ÑлÑÑае 'k' и 'N' ÑвлÑÑÑÑÑ Ð¿ÑоизволÑнÑми ÑелÑми ÑиÑлами, не ÑавнÑми нÑлÑ, а 'L' ÑвлÑеÑÑÑ Ð¿ÑоизволÑнÑм ÑелÑм ÑиÑлом, ÑдовлеÑвоÑÑÑÑим неÑавенÑÑÐ²Ñ 0â¤L<N.Turning to FIG. 11B, where if there is (kN + L) information about the number of parametric ranges and if Q bits are needed to represent each information about the number of parametric ranges, then a lot of data on the number of parametric ranges can be represented as the following group. In this case, 'k' and 'N' are arbitrary non-zero integers, and 'L' is an arbitrary integer satisfying the inequality 0â¤L <N.
ÐеÑод гÑÑппиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð²ÐºÐ»ÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ñаги ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ k гÑÑпп пÑÑем ÑвÑзÑÐ²Ð°Ð½Ð¸Ñ N инÑоÑмаÑий о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² и ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ Ð¿Ð¾Ñледней гÑÑÐ¿Ð¿Ñ Ð¿ÑÑем ÑвÑзÑÐ²Ð°Ð½Ð¸Ñ Ð¿Ð¾ÑÐ»ÐµÐ´Ð½Ð¸Ñ L инÑоÑмаÑий о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð². k гÑÑпп могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ Ð² виде M биÑ, а поÑледнÑÑ Ð³ÑÑппа Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена в виде p биÑ. Ð ÑÑом ÑлÑÑае пÑедпоÑÑиÑелÑно, ÑÑÐ¾Ð±Ñ M Ð±Ð¸Ñ Ð±Ñло менÑÑе N·Q биÑ, иÑполÑзÑемÑÑ Ð² ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹ инÑоÑмаÑии о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² без Ð¸Ñ Ð³ÑÑппиÑованиÑ. p Ð±Ð¸Ñ Ð¿ÑедпоÑÑиÑелÑно менÑÑе или Ñавно L·Q биÑ, иÑполÑзÑемÑÑ Ð² ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹ инÑоÑмаÑии о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² без Ð¸Ñ Ð³ÑÑппиÑованиÑ.The grouping method includes the steps of creating k groups by linking N information about the number of parametric ranges and creating the last group by linking the last L information about the number of parametric ranges. k groups can be represented as M bits, and the last group can be represented as p bits. In this case, it is preferable that the M bits be less than the N · Q bits used in the case of presenting each information about the number of parametric ranges without grouping them. The p bit is preferably less than or equal to L · Q bits used in the case of presenting each information about the number of parametric ranges without grouping them.
ÐÑедположим, напÑимеÑ, ÑÑо инÑоÑмаÑÐ¸Ñ Ð¾ колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² пÑедÑÑавлÑÐµÑ Ñобой b1 и b2 ÑооÑвеÑÑÑвенно. ÐÑли ÐºÐ°Ð¶Ð´Ð°Ñ Ð¸Ð· велиÑин b1 и b2 Ð¼Ð¾Ð¶ÐµÑ Ð¸Ð¼ÐµÑÑ Ð¿ÑÑÑ Ð·Ð½Ð°Ñений, Ñо Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹ из велиÑин b1 и b2 Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾ имеÑÑ 3 биÑа. Ð ÑÑом ÑлÑÑае Ñ Ð¾ÑÑ 3 биÑами можно пÑедÑÑавиÑÑ Ð²Ð¾ÑÐµÐ¼Ñ Ð·Ð½Ð°Ñений, ÑакÑиÑеÑки поÑÑебÑеÑÑÑ ÑолÑко пÑÑÑ Ð·Ð½Ð°Ñений. То еÑÑÑ ÐºÐ°Ð¶Ð´Ð°Ñ Ð¸Ð· велиÑин b1 и b2 Ð¸Ð¼ÐµÐµÑ ÑÑи избÑÑоÑнÑÑ Ð·Ð½Ð°ÑениÑ. ÐÑоме Ñого, в ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ b1 и b2 в виде гÑÑÐ¿Ð¿Ñ Ð¿ÑÑем ÑвÑзÑÐ²Ð°Ð½Ð¸Ñ b1 и b2 вмеÑÑе, вмеÑÑо 6 Ð±Ð¸Ñ (=3 биÑа + 3 биÑа) можно иÑполÑзоваÑÑ 5 биÑ. Ð ÑаÑÑноÑÑи, поÑколÑÐºÑ Ð²Ñе комбинаÑии b1 и b2 вклÑÑаÑÑ Ð² ÑÐµÐ±Ñ 25 (=5·5) ваÑианÑов, гÑÑппа из b1 и b2 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена 5 биÑами. ÐоÑколÑÐºÑ 5 Ð±Ð¸Ñ Ð¼Ð¾Ð³ÑÑ Ð¿ÑедÑÑавлÑÑÑ 32 знаÑениÑ, в ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð² виде гÑÑÐ¿Ð¿Ñ ÑоздаеÑÑÑ ÑÐµÐ¼Ñ Ð¸Ð·Ð±ÑÑоÑнÑÑ Ð·Ð½Ð°Ñений. ÐÑоме Ñого, в ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¿ÑÑем гÑÑппиÑÐ¾Ð²Ð°Ð½Ð¸Ñ b1 и b2 избÑÑоÑноÑÑÑ Ð¿Ð¾Ð»ÑÑаеÑÑÑ Ð¼ÐµÐ½ÑÑей, Ñем в ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹ из велиÑин b1 и b2 в виде 3 биÑ. СпоÑоб пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¼Ð½Ð¾Ð¶ÐµÑÑва даннÑÑ Ð¾ колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² в виде гÑÑпп Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ñеализован ÑазлиÑнÑми пÑÑÑми ÑледÑÑÑим обÑазом.Suppose, for example, that the information on the number of parametric ranges is b1 and b2, respectively. If each of the values of b1 and b2 can have five values, then to represent each of the values of b1 and b2 it is necessary to have 3 bits. In this case, although eight values can be represented in 3 bits, in fact only five values are needed. That is, each of the quantities b1 and b2 has three redundant values. In addition, in the case of representing b1 and b2 as a group by linking b1 and b2 together, instead of 6 bits (= 3 bits + 3 bits), 5 bits can be used. In particular, since all combinations of b1 and b2 include 25 (= 5 · 5) options, a group of b1 and b2 can be represented by 5 bits. Since 5 bits can represent 32 values, when presented as a group, seven redundant values are created. In addition, in the case of representing by grouping b1 and b2, the redundancy is less than in the case of representing each of the values of b1 and b2 as 3 bits. A method of representing a plurality of data on the number of parametric ranges in the form of groups can be implemented in various ways as follows.
ÐÑли множеÑÑво даннÑÑ Ð¾ колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð¸Ð¼ÐµÐµÑ 40 знаÑений каждое, Ñо ÑоздаеÑÑÑ k гÑÑпп Ñ Ð¸ÑполÑзованием в каÑеÑÑве N знаÑений 2, 3, 4, 5 или 6. k гÑÑпп могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ 11, 16, 22, 27 и 32 биÑами ÑооÑвеÑÑÑвенно. РалÑÑеÑнаÑивном ваÑианÑе k гÑÑпп пÑедÑÑавлÑÑÑ Ð¿ÑÑем комбиниÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑооÑвеÑÑÑвÑÑÑÐ¸Ñ Ð²Ð°ÑианÑов.If the data set on the number of parametric ranges has 40 values each, then k groups are created using N, values 2, 3, 4, 5, or 6. k groups can be represented by 11, 16, 22, 27, and 32 bits, respectively. Alternatively, k groups are represented by combining the appropriate options.
ÐÑли множеÑÑво инÑоÑмаÑий о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð¸Ð¼ÐµÐµÑ 28 знаÑений Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹, Ñо ÑоздаеÑÑÑ k гÑÑпп Ñ Ð¸ÑполÑзованием в каÑеÑÑве N знаÑÐµÐ½Ð¸Ñ 6, и k гÑÑпп можно пÑедÑÑавиÑÑ 29 биÑами.If a lot of information about the number of parametric ranges has 28 values for each, then k groups are created using 6 as N, and k groups can be represented by 29 bits.
ÐÑли множеÑÑво инÑоÑмаÑий о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð¸Ð¼ÐµÐµÑ 20 знаÑений Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹, Ñо ÑоздаеÑÑÑ k гÑÑпп Ñ Ð¸ÑполÑзованием в каÑеÑÑве N знаÑений 2, 3, 4, 5, 6 или 7. k гÑÑпп могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ 9, 13, 18, 22, 26 и 31 биÑами ÑооÑвеÑÑÑвенно. РалÑÑеÑнаÑивном ваÑианÑе k гÑÑпп могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ Ð¿ÑÑем комбиниÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑооÑвеÑÑÑвÑÑÑÐ¸Ñ ÑлÑÑаев.If a lot of information about the number of parametric ranges has 20 values for each, then k groups are created using N, values 2, 3, 4, 5, 6 or 7. k groups can be represented 9, 13, 18, 22, 26 and 31 bits respectively. Alternatively, k groups may be represented by combining appropriate cases.
ÐÑли множеÑÑво инÑоÑмаÑий о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð¸Ð¼ÐµÐµÑ 14 знаÑений Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹, Ñо ÑоздаеÑÑÑ k гÑÑпп Ñ Ð¸ÑполÑзованием в каÑеÑÑве N знаÑÐµÐ½Ð¸Ñ 6. k гÑÑпп можно пÑедÑÑавиÑÑ 23 биÑами.If the set of information on the number of parametric ranges has 14 values for each, then k groups are created using N as the value 6. 6. k groups can be represented by 23 bits.
ÐÑли множеÑÑво инÑоÑмаÑий о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð¸Ð¼ÐµÐµÑ 10 знаÑений Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹, Ñо ÑоздаеÑÑÑ k гÑÑпп Ñ Ð¸ÑполÑзованием в каÑеÑÑве N знаÑений 2, 3, 4, 5, 6, 7, 8 или 9. k гÑÑпп могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ 7, 10, 14, 17, 20, 24, 27 и 30 биÑами ÑооÑвеÑÑÑвенно. РалÑÑеÑнаÑивном ваÑианÑе k гÑÑпп могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ Ð¿ÑÑем комбиниÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑооÑвеÑÑÑвÑÑÑÐ¸Ñ ÑлÑÑаев.If a lot of information about the number of parametric ranges has 10 values for each, then k groups are created using N, values 2, 3, 4, 5, 6, 7, 8, or 9. k groups can be represented 7, 10, 14, 17, 20, 24, 27 and 30 bits respectively. Alternatively, k groups may be represented by combining appropriate cases.
ÐÑли множеÑÑво инÑоÑмаÑий о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð¸Ð¼ÐµÐµÑ 7 знаÑений Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹, Ñо ÑоздаеÑÑÑ k гÑÑпп Ñ Ð¸ÑполÑзованием в каÑеÑÑве N знаÑений 6, 7, 8, 9, 10 или 11. k гÑÑпп могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ 17, 20, 23, 26, 29 и 31 биÑами ÑооÑвеÑÑÑвенно. РалÑÑеÑнаÑивном ваÑианÑе k гÑÑпп пÑедÑÑавлÑÑÑÑÑ Ð¿ÑÑем комбиниÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑооÑвеÑÑÑвÑÑÑÐ¸Ñ ÑлÑÑаев.If the set of information about the number of parametric ranges has 7 values for each, then k groups are created using N, values 6, 7, 8, 9, 10 or 11. k groups can be represented 17, 20, 23, 26, 29 and 31 bits respectively. Alternatively, k groups are represented by combining appropriate cases.
ÐÑли множеÑÑво инÑоÑмаÑий о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² имееÑ, напÑимеÑ, 5 знаÑений Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹, Ñо ÑоздаеÑÑÑ k гÑÑпп Ñ Ð¸ÑполÑзованием в каÑеÑÑве N знаÑений 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12 или 13. k гÑÑпп могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ 5, 7, 10, 12, 14, 17, 19, 21, 24, 26, 28 и 31 биÑами ÑооÑвеÑÑÑвенно. РалÑÑеÑнаÑивном ваÑианÑе k гÑÑпп пÑедÑÑавлÑÑÑÑÑ Ð¿ÑÑем комбиниÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑооÑвеÑÑÑвÑÑÑÐ¸Ñ ÑлÑÑаев.If a lot of information about the number of parametric ranges has, for example, 5 values for each, then k groups are created using N, values 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, or 13. k groups can be represented by 5, 7, 10, 12, 14, 17, 19, 21, 24, 26, 28, and 31 bits, respectively. Alternatively, k groups are represented by combining appropriate cases.
ÐÑоме Ñого, множеÑÑво инÑоÑмаÑий о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ ÑконÑигÑÑиÑовано Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð² виде вÑÑеопиÑаннÑÑ Ð³ÑÑпп или Ð´Ð»Ñ Ð¿Ð¾ÑледоваÑелÑного пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¿ÑÑем ÑоÑмиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹ инÑоÑмаÑии о колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² в виде незавиÑимой биÑовой поÑледоваÑелÑноÑÑи.In addition, a lot of information about the number of parametric ranges can be configured to be presented in the form of the above groups or for sequential presentation by generating each information about the number of parametric ranges in the form of an independent bit sequence.
Ðа Ñиг. 12 показан ÑинÑакÑиÑ, пÑедÑÑавлÑÑÑий инÑоÑмаÑÐ¸Ñ Ð¾ конÑигÑÑаÑии пÑоÑÑÑанÑÑвенного кадÑа ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. ÐÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ Ð²ÐºÐ»ÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð±Ð»Ð¾Ðº âFramingInfoâ 1201, блок âbsIndependencyfieldâ 1202, блок âOttDataâ 1203, блок âTttDataâ 1204, блок âSmgDataâ 1205 и блок âtempShapeDataâ 1206.In FIG. 12 is a syntax showing spatial frame configuration information according to one embodiment of the present invention. The spatial frame includes a FramingInfo block 1201, a bsIndependencyfield block 1202, an OttData block 1203, a TttData block 1204, a SmgData block 1205, and a tempShapeData block 1206.
Ðлок âFramingInfoâ 1201 вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ колиÑеÑÑве набоÑов паÑамеÑÑов и инÑоÑмаÑÐ¸Ñ Ð¾ вÑеменном инÑеÑвале, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ ÐºÐ°Ð¶Ð´Ñй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов. Ðлок âFramingInfoâ 1201 подÑобно обÑÑÑнÑеÑÑÑ Ñо ÑÑÑлками на Ñиг. 13Ð.The âFramingInfoâ block 1201 includes information about the number of parameter sets and information about the time interval for which each parameter set is applied. The âFramingInfoâ block 1201 is explained in detail with reference to FIG. 13A.
Ðоле âbsIndependencyfieldâ 1202 ÑказÑваеÑ, можно ли декодиÑоваÑÑ ÑекÑÑий ÐºÐ°Ð´Ñ Ð±ÐµÐ· Ñведений о пÑедÑдÑÑем кадÑе.The bsIndependencyfield 1202 field indicates whether the current frame can be decoded without information about the previous frame.
Ðлок âOttDataâ 1203 вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð²ÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ пÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑÐ°Ñ Ð´Ð»Ñ Ð²ÑÐµÑ Ð±Ð»Ð¾ÐºÐ¾Ð² OTT.The OttData block 1203 includes all spatial parameter information for all OTT blocks.
Ðлок âTttDataâ 1204 вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð²ÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ пÑоÑÑÑанÑÑвеннÑÑ Ð¿Ð°ÑамеÑÑÐ°Ñ Ð´Ð»Ñ Ð²ÑÐµÑ Ð±Ð»Ð¾ÐºÐ¾Ð² TTT.The âTttDataâ block 1204 includes all spatial parameter information for all TTT blocks.
Ðлок âSmgDataâ 1205 вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð´Ð»Ñ Ð²Ñеменного ÑглаживаниÑ, пÑименÑемÑÑ Ð´Ð»Ñ Ð´ÐµÐºÐ²Ð°Ð½ÑизиÑованного пÑоÑÑÑанÑÑвенного паÑамеÑÑа.The âSmgDataâ block 1205 includes temporal smoothing information used for the dequantized spatial parameter.
Ðлок âtempShapeDataâ 1206 вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð´Ð»Ñ ÑоÑмиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð²Ñеменной огибаÑÑей, пÑименÑемой Ð´Ð»Ñ Ð´ÐµÐºÐ¾ÑÑелиÑованного Ñигнала.The âtempShapeDataâ block 1206 includes information for generating the temporal envelope used for the decorrelated signal.
Ðа Ñиг. 13Рпоказан ÑинÑакÑÐ¸Ñ Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¸Ð½ÑоÑмаÑии о положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. Ðоле âbsFramingTypeâ 1301 ÑказÑваеÑ, ÑвлÑеÑÑÑ Ð»Ð¸ пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ Ð°ÑдиоÑигнала ÑикÑиÑованнÑм кадÑом или пеÑеменнÑм кадÑом. ФикÑиÑованнÑй ÐºÐ°Ð´Ñ Ð¾Ð·Ð½Ð°ÑÐ°ÐµÑ ÐºÐ°Ð´Ñ, в коÑоÑом Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов пÑименÑеÑÑÑ Ð´Ð»Ñ Ð¿ÑедваÑиÑелÑно ÑÑÑановленного вÑеменного инÑеÑвала. ÐапÑимеÑ, Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов пÑименÑеÑÑÑ Ðº вÑÐµÐ¼ÐµÐ½Ð½Ð¾Ð¼Ñ Ð¸Ð½ÑеÑвалÑ, заÑанее ÑÑÑÐ°Ð½Ð¾Ð²Ð»ÐµÐ½Ð½Ð¾Ð¼Ñ Ñ ÑавнÑм инÑеÑвалом. ÐеÑеменнÑй ÐºÐ°Ð´Ñ Ð¾Ð·Ð½Ð°ÑÐ°ÐµÑ ÐºÐ°Ð´Ñ, коÑоÑÑй избиÑаÑелÑно пÑÐ¸Ð½Ð¸Ð¼Ð°ÐµÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов.In FIG. 13A, a syntax for presenting position information of a time interval for which a set of parameters is applied is shown, according to one embodiment of the present invention. The âbsFramingTypeâ field 1301 indicates whether the spatial frame of the audio signal is a fixed frame or a variable frame. Fixed frame means a frame in which a set of parameters is applied to a preset time interval. For example, a set of parameters is applied to a time interval predefined at an equal interval. A variable frame means a frame that selectively receives information about the position of a time interval for which a set of parameters is applied.
Ðоле âbsNumParamSetsâ 1302 ÑказÑÐ²Ð°ÐµÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво набоÑов паÑамеÑÑов в одном пÑоÑÑÑанÑÑвенном кадÑе (назÑваемое далее âNumParamSetsâ), пÑиÑем Ð¼ÐµÐ¶Ð´Ñ âNumParamSetsâ и âbsNumParamSetsâ ÑÑÑеÑÑвÑÐµÑ ÑооÑноÑение âNumParamSets = bsNumParamSets +1â.The âbsNumParamSetsâ field 1302 indicates the number of parameter sets in one spatial frame (hereinafter referred to as âNumParamSetsâ), and the relation âNumParamSets = bsNumParamSets +1â exists between âNumParamSetsâ and âbsNumParamSetsâ.
ÐапÑимеÑ, поÑколÑÐºÑ Ð´Ð»Ñ Ð¿Ð¾Ð»Ñ âbsNumParamSetsâ 1302 на Ñиг. 13РвÑделено 3 биÑа, в одном пÑоÑÑÑанÑÑвенном кадÑе можно обеÑпеÑиÑÑ Ð¼Ð°ÐºÑимÑм воÑÐµÐ¼Ñ Ð½Ð°Ð±Ð¾Ñов паÑамеÑÑов. ÐоÑколÑÐºÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво вÑделеннÑÑ Ð±Ð¸Ñ Ð½Ðµ огÑаниÑено, в пÑоÑÑÑанÑÑвенном кадÑе можно обеÑпеÑиÑÑ Ð±Ð¾Ð»ÑÑе набоÑов паÑамеÑÑов.For example, since for the âbsNumParamSetsâ field 1302 in FIG. 13A, 3 bits are allocated; a maximum of eight sets of parameters can be provided in one spatial frame. Since the number of allocated bits is not limited, more sets of parameters can be provided in a spatial frame.
ÐÑли пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ Ð¾ÑноÑиÑÑÑ Ðº ÑикÑиÑÐ¾Ð²Ð°Ð½Ð½Ð¾Ð¼Ñ ÑипÑ, Ñо инÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¾Ð¿Ñеделена ÑоглаÑно заÑанее ÑÑÑÐ°Ð½Ð¾Ð²Ð»ÐµÐ½Ð½Ð¾Ð¼Ñ Ð¿ÑавилÑ, и в дополниÑелÑной инÑоÑмаÑии о положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ð½ÐµÑ Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾ÑÑи. Ðднако еÑли пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ Ð¾ÑноÑиÑÑÑ Ðº пеÑÐµÐ¼ÐµÐ½Ð½Ð¾Ð¼Ñ ÑипÑ, Ñо Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾ имеÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов.If the spatial frame is of a fixed type, then information about the position of the time interval for which the set of parameters is applied can be determined according to a predefined rule, and there is no need for additional information about the position of the time interval for which the set of parameters is applied. However, if the spatial frame is of a variable type, then it is necessary to have information about the position of the time interval for which the set of parameters is applied.
Ðоле âbsParamSlotâ 1303 ÑказÑÐ²Ð°ÐµÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов. Ðоле âbsParamSlotâ 1303 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ Ñ Ð¸ÑполÑзованием неÑколÑÐºÐ¸Ñ Ð²ÑеменнÑÑ Ð¸Ð½ÑеÑвалов в одном пÑоÑÑÑанÑÑвенном кадÑе, Ñо еÑÑÑ ânumSlotsâ. Ð ÑаÑÑноÑÑи, в ÑлÑÑае когда ânumSlotsâ болÑÑе или Ñавно 2(n-1) и менÑÑе 2(n), поле âbsParamSlotâ 1303 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено n биÑами.The âbsParamSlotâ field 1303 indicates the position information of the time interval for which the parameter set is applied. The âbsParamSlotâ field 1303 may be represented by a variable number of bits using multiple time intervals in one spatial frame, that is, ânumSlotsâ. In particular, in the case where ânumSlotsâ is greater than or equal to 2 (n-1) and less than 2 (n) , the field âbsParamSlotâ 1303 may be represented by n bits.
ÐапÑимеÑ: (i) еÑли ânumSlotsâ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑ Ð² диапазоне Ð¼ÐµÐ¶Ð´Ñ 64 и 127, Ñо поле âbsParamSlotâ 1303 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено 7 биÑами; (ii) еÑли ânumSlotsâ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑ Ð² диапазоне Ð¼ÐµÐ¶Ð´Ñ 32 и 63, Ñо поле âbsParamSlotâ 1303 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено 6 биÑами; (iii) еÑли ânumSlotsâ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑ Ð² диапазоне Ð¼ÐµÐ¶Ð´Ñ 16 и 31, Ñо поле âbsParamSlotâ 1303 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено 5 биÑами; (iv) еÑли ânumSlotsâ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑ Ð² диапазоне Ð¼ÐµÐ¶Ð´Ñ 8 и 15, Ñо поле âbsParamSlotâ 1303 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено 4 биÑами; (v) еÑли ânumSlotsâ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑ Ð² диапазоне Ð¼ÐµÐ¶Ð´Ñ 4 и 7, Ñо поле âbsParamSlotâ 1303 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено 3 биÑами; (vi) еÑли ânumSlotsâ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑ Ð² диапазоне Ð¼ÐµÐ¶Ð´Ñ 2 и 3, Ñо поле âbsParamSlotâ 1303 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено 2 биÑами; (vii) еÑли ânumSlotsâ Ñавно 1, Ñо поле âbsParamSlotâ 1303 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено 1 биÑом; и (viii) еÑли ânumSlotsâ Ñавно 0, Ñо поле âbsParamSlotâ 1303 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено 0 биÑ. ÐналогиÑнÑм обÑазом, еÑли ânumSlotsâ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑ Ð² диапазоне Ð¼ÐµÐ¶Ð´Ñ 64 и 127, Ñо поле âbsParamSlotâ 1303 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено 7 биÑами.For example: (i) if ânumSlotsâ is between 64 and 127, then the âbsParamSlotâ 1303 field may be represented by 7 bits; (ii) if ânumSlotsâ is between 32 and 63, then the âbsParamSlotâ 1303 field may be represented by 6 bits; (iii) if ânumSlotsâ is between 16 and 31, then the âbsParamSlotâ 1303 field may be represented by 5 bits; (iv) if ânumSlotsâ is between 8 and 15, then the âbsParamSlotâ 1303 field may be represented by 4 bits; (v) if ânumSlotsâ is between 4 and 7, then the âbsParamSlotâ 1303 field may be represented by 3 bits; (vi) if ânumSlotsâ is between 2 and 3, then the âbsParamSlotâ 1303 field may be represented by 2 bits; (vii) if ânumSlotsâ is 1, then the field âbsParamSlotâ 1303 may be represented by 1 bit; and (viii) if ânumSlotsâ is 0, then the âbsParamSlotâ field 1303 may be represented with 0 bits. Similarly, if ânumSlotsâ is between 64 and 127, then the âbsParamSlotâ 1303 field may be represented by 7 bits.
ÐÑли имееÑÑÑ Ð¼Ð½Ð¾Ð¶ÐµÑÑво (N) набоÑов паÑамеÑÑов, Ñо комбинаÑÐ¸Ñ âbsParamSlotâ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена ÑоглаÑно ÑоÑмÑле 9.If there are many (N) parameter sets, then the combination âbsParamSlotâ can be represented according to formula 9.
[ФоÑмÑла 9][Formula 9]
Ð ÑÑом ÑлÑÑае âbsParamSlotiâ ÑказÑÐ²Ð°ÐµÑ Ð²Ñеменной инÑеÑвал, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ i-й Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов. ÐÑедположим, напÑимеÑ, ÑÑо ânumSlotsâ Ñавно 3 и ÑÑо поле âbsParamSlotâ 1303 Ð¼Ð¾Ð¶ÐµÑ Ð¸Ð¼ÐµÑÑ Ð´ÐµÑÑÑÑ Ð·Ð½Ð°Ñений. Ð ÑÑом ÑлÑÑае Ð´Ð»Ñ Ð¿Ð¾Ð»Ñ âbsParamSlotâ 1303 Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾ ÑÑи инÑоÑмаÑии (далее назÑваемÑе Ñ1, Ñ2 и Ñ3 ÑооÑвеÑÑÑвенно). ÐоÑколÑÐºÑ Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹ (Ñ1, Ñ2 и Ñ3) Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾ 4 биÑа, вÑего поÑÑебÑеÑÑÑ 12 (= 4·3) биÑа. Ð ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ñ1, Ñ2 и Ñ3 в виде гÑÑÐ¿Ð¿Ñ Ð¿ÑÑем ÑвÑзÑÐ²Ð°Ð½Ð¸Ñ Ð¸Ñ Ð²Ð¼ÐµÑÑе, Ð¼Ð¾Ð¶ÐµÑ Ð²Ð¾Ð·Ð½Ð¸ÐºÐ½ÑÑÑ 1000 (=10·10·10) ÑлÑÑаев, коÑоÑÑе могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ 10 биÑами, ÑÑо ÑÑÐºÐ¾Ð½Ð¾Ð¼Ð¸Ñ 2 биÑа. ÐÑли ânumSlotsâ Ñавно 3 и еÑли ÑÑиÑанное знаÑение в виде 5 Ð±Ð¸Ñ ÑоÑÑавлÑÐµÑ 31, Ñо ÑÑо знаÑение Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено как 31=1·(32)+5·(31)+7·(30). ÐекодиÑÑÑÑее ÑÑÑÑойÑÑво Ð¼Ð¾Ð¶ÐµÑ Ð¾Ð¿ÑеделиÑÑ, ÑÑо Ñ1, Ñ2 и Ñ3 ÑоÑÑавлÑÑÑ 1, 5 и 7 ÑооÑвеÑÑÑвенно, пÑименив инвеÑÑÐ¸Ñ ÑоÑмÑÐ»Ñ 9.In this case, âbsParamSlot i â indicates the time interval for which the ith set of parameters is applied. Suppose, for example, that ânumSlotsâ is 3 and that the field âbsParamSlotâ 1303 can have ten values. In this case, three information is needed for the âbsParamSlotâ field 1303 (hereinafter referred to as c1, c2 and c3, respectively). Since 4 bits are needed to represent each (c1, c2 and c3), a total of 12 (= 4 · 3) bits are required. In the case of representing c1, c2 and c3 as a group by linking them together, 1000 (= 10 · 10 · 10) cases may arise that can be represented by 10 bits, which will save 2 bits. If ânumSlotsâ is 3 and if the read value in the form of 5 bits is 31, then this value can be represented as 31 = 1 · (3 2 ) + 5 · (3 1 ) + 7 · (3 0 ). The decoding device can determine that c1, c2 and c3 are 1, 5 and 7, respectively, by applying the inverse of formula 9.
Ðа Ñиг. 13Рпоказан ÑинÑакÑÐ¸Ñ Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¸Ð½ÑоÑмаÑии о положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, в виде абÑолÑÑного знаÑÐµÐ½Ð¸Ñ Ð¸ знаÑÐµÐ½Ð¸Ñ ÑазноÑÑи ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. ÐÑли пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ ÑвлÑеÑÑÑ ÐºÐ°Ð´Ñом пеÑеменного Ñипа, Ñо поле âbsParamSlotâ 1303 на Ñиг. 13Ð Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено в виде абÑолÑÑного знаÑÐµÐ½Ð¸Ñ Ð¸ знаÑÐµÐ½Ð¸Ñ ÑазноÑÑи Ñ ÑÑеÑом Ñого ÑакÑа, ÑÑо знаÑение инÑоÑмаÑии âbsParamSlotâ моноÑонно возÑаÑÑаеÑ.In FIG. 13B, a syntax for presenting position information of a time interval for which a set of parameters is applied is shown as an absolute value and a difference value according to one embodiment of the present invention. If the spatial frame is a variable type frame, then the âbsParamSlotâ field 1303 in FIG. 13A may be represented as an absolute value and a difference value, taking into account the fact that the value of the âbsParamSlotâ information is monotonically increasing.
ÐапÑимеÑ: (i) положение вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð¿ÐµÑвÑй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ ÑÑоÑмиÑовано как абÑолÑÑное знаÑение, Ñо еÑÑÑ âbsParamSlot[0]â; и (ii) положение вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð²ÑоÑой или поÑледÑÑÑий Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ ÑÑоÑмиÑовано в виде знаÑÐµÐ½Ð¸Ñ ÑазноÑÑи, Ñо еÑÑÑ âdifference valueâ Ð¼ÐµÐ¶Ð´Ñ âbsParamSlot[ps]â и âbsParamSlot[ps-1]â или âdifference value-1â (далее назÑваемое âbsDiffParamSlot[ps]â). Ð ÑÑом ÑлÑÑае âpsâ ознаÑÐ°ÐµÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов.For example: (i) the position of the time interval for which the first set of parameters is applied can be formed as an absolute value, that is, âbsParamSlot [0]â; and (ii) the position of the time interval for which the second or subsequent set of parameters is applied can be formed as a difference value, that is, a âdifference valueâ between âbsParamSlot [ps]â and âbsParamSlot [ps-1]â or âdifference value-1 â(hereinafter referred to asâ bsDiffParamSlot [ps] â). In this case, âpsâ means a set of parameters.
Ðоле âbsParamSlot[0]â 1304 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено колиÑеÑÑвом Ð±Ð¸Ñ (далее назÑваемÑм ânBitsParamSlot(0)â), вÑÑиÑленнÑм Ñ Ð¸ÑполÑзованием ânumSlotsâ и ânumParamSetsâ.The âbsParamSlot [0]â field 1304 may be represented by the number of bits (hereinafter referred to as ânBitsParamSlot (0)â) calculated using ânumSlotsâ and ânumParamSetsâ.
Ðоле âbsDiffParamSlot[ps]â 1305 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено колиÑеÑÑвом Ð±Ð¸Ñ (далее назÑваемÑм ânBitsParamSlot(ps)â), вÑÑиÑленнÑм Ñ Ð¸ÑполÑзованием ânumSlotsâ, ânumParamSetsâ и Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð²Ñеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð¿ÑедÑдÑÑий Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ñо еÑÑÑ âbsParamSlot[ps-1]â.The âbsDiffParamSlot [ps]â field 1305 may be represented by the number of bits (hereinafter referred to as ânBitsParamSlot (ps)â) calculated using ânumSlotsâ, ânumParamSetsâ and the position of the time interval for which the previous parameter set is applied, that is, âbsParamSlot [ps-1]. â
Ð ÑаÑÑноÑÑи, Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ âbsParamSlot[ps]â минималÑнÑм колиÑеÑÑвом Ð±Ð¸Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑво Ð±Ð¸Ñ Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ âbsParamSlot[ps]â Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑинÑÑо на оÑнове ÑледÑÑÑÐ¸Ñ Ð¿Ñавил: (i) множеÑÑво âbsParamSlot[ps]â ÑвелиÑиваеÑÑÑ Ð² возÑаÑÑаÑÑей поÑледоваÑелÑноÑÑи (bsParamSlot[ps] > bsParamSlot[ps-1]); (ii) макÑималÑное знаÑение âbsParamSlot[0]â Ñавно ânumSlots - numParamSetsâ; и (iii) в ÑлÑÑае еÑли 0 < ps < numParamSets, âbsParamSlot[ps]â Ð¼Ð¾Ð¶ÐµÑ Ð¸Ð¼ÐµÑÑ Ð·Ð½Ð°Ñение ÑолÑко Ð¼ÐµÐ¶Ð´Ñ âbsParamSlot[ps-1] +1â и ânumSlots - numParamSets + psâ.In particular, to represent âbsParamSlot [ps]â with the minimum number of bits, the number of bits to represent âbsParamSlot [ps]â can be adopted based on the following rules: (i) the set âbsParamSlot [ps]â increases in ascending order (bsParamSlot [ps ]> bsParamSlot [ps-1]); (ii) the maximum value of âbsParamSlot [0]â is equal to ânumSlots - numParamSetsâ; and (iii) if 0 <ps <numParamSets, âbsParamSlot [ps]â can only mean between âbsParamSlot [ps-1] +1â and ânumSlots - numParamSets + psâ.
ÐапÑимеÑ, еÑли ânumSlotsâ Ñавно 10 и еÑли ânumParamSetsâ Ñавно 3, Ñо поÑколÑÐºÑ âbsParamSlot[ps]â возÑаÑÑаеÑ, Ñо макÑималÑное знаÑение âbsParamSlot[0]â ÑÑановиÑÑÑ ÑавнÑм '10-3=7'. Рименно, âbsParamSlot[0]â должно вÑбиÑаÑÑÑÑ Ð¸Ð· знаÑений Ð¾Ñ 0 до 7. ÐÑиÑина ÑÑого заклÑÑаеÑÑÑ Ð² Ñом, ÑÑо колиÑеÑÑво вÑеменнÑÑ Ð¸Ð½ÑеÑвалов Ð´Ð»Ñ Ð¾ÑÑалÑнÑÑ Ð½Ð°Ð±Ð¾Ñов паÑамеÑÑов (напÑимеÑ, еÑли ps Ñавно 1 или 2) недоÑÑаÑоÑно, еÑли âbsParamSlot[0]â Ð¸Ð¼ÐµÐµÑ Ð·Ð½Ð°Ñение, болÑÑее 7.For example, if ânumSlotsâ is 10 and if ânumParamSetsâ is 3, then since âbsParamSlot [ps]â is increasing, then the maximum value of âbsParamSlot [0]â becomes '10 -3 = 7 '. Namely, âbsParamSlot [0]â must be selected from values from 0 to 7. The reason for this is that the number of time intervals for the remaining sets of parameters (for example, if ps is 1 or 2) is not enough if âbsParamSlot [0] âHas a value greater than 7.
ÐÑли âbsParamSlot[0]â Ñавно 5, Ñо положение bsParamSlot[1] вÑеменного инÑеÑвала Ð´Ð»Ñ Ð²ÑоÑого набоÑа паÑамеÑÑов должно вÑбиÑаÑÑÑÑ Ð¸Ð· знаÑений Ð¼ÐµÐ¶Ð´Ñ '5+1=6' и '10-3+1=8'.If âbsParamSlot [0]â is 5, then the position of bsParamSlot [1] of the time interval for the second set of parameters should be selected from the values between '5 + 1 = 6' and '10 -3 + 1 = 8 '.
ÐÑли âbsParamSlot[1]â Ñавно 7, Ñо âbsParamSlot[2]â Ð¼Ð¾Ð¶ÐµÑ ÑÑаÑÑ ÑавнÑм 8 или 9. ÐÑли âbsParamSlot[1]â Ñавно 8, Ñо âbsParamSlot[2]â Ð¼Ð¾Ð¶ÐµÑ ÑÑаÑÑ ÑавнÑм 9.If âbsParamSlot [1]â is equal to 7, then âbsParamSlot [2]â can become equal to 8 or 9. If âbsParamSlot [1]â is equal to 8, then âbsParamSlot [2]â can become equal to 9.
СледоваÑелÑно, âbsParamSlot[ps]â Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом Ð±Ð¸Ñ Ñ Ð¸ÑполÑзованием вÑÑеÑказаннÑÑ Ð¿Ñизнаков вмеÑÑо пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð² виде ÑикÑиÑованного колиÑеÑÑва биÑ.Therefore, âbsParamSlot [ps]â can be represented by a variable number of bits using the above features instead of being represented as a fixed number of bits.
ÐÑи конÑигÑÑиÑовании âbsParamSlot[ps]â в биÑовом поÑоке еÑли âpsâ Ñавно 0, Ñо âbsParamSlot[0]â Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено в виде абÑолÑÑного знаÑÐµÐ½Ð¸Ñ Ñ Ð¿Ð¾Ð¼Ð¾ÑÑÑ ÐºÐ¾Ð»Ð¸ÑеÑÑва биÑ, ÑооÑвеÑÑÑвÑÑÑÐ¸Ñ ânBitsParamSlot(0)â. ÐÑли âpsâ болÑÑе 0, Ñо âbsParamSlot[ps]â Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено в виде знаÑÐµÐ½Ð¸Ñ ÑазноÑÑи Ñ Ð¿Ð¾Ð¼Ð¾ÑÑÑ ÐºÐ¾Ð»Ð¸ÑеÑÑва биÑ, ÑооÑвеÑÑÑвÑÑÑÐ¸Ñ ânBitsParamSlot(ps)â. ÐÑи ÑÑиÑÑвании ÑконÑигÑÑиÑованного вÑÑе âbsParamSlot[ps]â из биÑового поÑока Ð´Ð»Ð¸Ð½Ñ Ð±Ð¸Ñового поÑока Ð´Ð»Ñ ÐºÐ°Ð¶Ð´ÑÑ Ð´Ð°Ð½Ð½ÑÑ , Ñо еÑÑÑ ânBitsParamSlot(ps)â, можно найÑи, иÑполÑзовав ÑоÑмÑÐ»Ñ 10.When configuring âbsParamSlot [ps]â in the bitstream, if âpsâ is 0, then âbsParamSlot [0]â can be represented as an absolute value using the number of bits corresponding to ânBitsParamSlot (0)â. If âpsâ is greater than 0, then âbsParamSlot [ps]â can be represented as the difference value using the number of bits corresponding to ânBitsParamSlot (ps)â. When reading the âbsParamSlot [ps]â configured above from the bitstream, the length of the bitstream for each data, that is, ânBitsParamSlot (ps),â can be found using formula 10.
[ФоÑмÑла 10][Formula 10]
Ð ÑаÑÑноÑÑи, ânBitsParamSlot(ps)â можно найÑи как nBitsParamSlot(0) = fb(numSlots - numParamSets +1). ÐÑли 0<ps<numParamSets, Ñо ânBitsParamSlot(ps)â можно найÑи как nBitsParamSlot(ps) = fb(numSlots - numParamSets + ps - bsParamSlot[ps-1]). ânBitsParamSlot(ps)â можно опÑеделиÑÑ, еÑли иÑполÑзоваÑÑ ÑоÑмÑÐ»Ñ 11, коÑоÑÐ°Ñ Ð´Ð¾Ð¿Ð¾Ð»Ð½ÑÐµÑ ÑоÑмÑÐ»Ñ 10 до 7 биÑ.In particular, ânBitsParamSlot (ps)â can be found as nBitsParamSlot (0) = f b (numSlots - numParamSets +1). If 0 <ps <numParamSets, then ânBitsParamSlot (ps)â can be found as nBitsParamSlot (ps) = f b (numSlots - numParamSets + ps - bsParamSlot [ps-1]). âNBitsParamSlot (ps)â can be defined using formula 11, which complements formula 10 to 7 bits.
[ФоÑмÑла 11][Formula 11]
Ðалее пÑиводиÑÑÑ Ð¿ÑÐ¸Ð¼ÐµÑ ÑÑнкÑии fb(x). ÐÑли ânumSlotsâ Ñавно 15 и еÑли ânumParamSetsâ Ñавно 3, Ñо ÑÑÑ ÑÑнкÑÐ¸Ñ Ð¼Ð¾Ð¶Ð½Ð¾ оÑениÑÑ ÐºÐ°Ðº nBitsParamSlot(0)=fb(15-3+1)=4 биÑа.The following is an example of the function f b (x). If ânumSlotsâ is 15 and if ânumParamSetsâ is 3, then this function can be evaluated as nBitsParamSlot (0) = f b (15-3 + 1) = 4 bits.
ÐÑли âbsParamSlot[0]â, пÑедÑÑавленное 4 биÑами, Ñавно 7, Ñо ÑÐºÐ°Ð·Ð°Ð½Ð½Ð°Ñ ÑÑнкÑÐ¸Ñ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¾Ñенена как nBitsParamSlot(1)=fb(15-3+1-7)=3 биÑа. Ð ÑÑом ÑлÑÑае поле âbsDiffParamSlot[1]â 1305 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено 3 биÑами.If âbsParamSlot [0]â represented by 4 bits is 7, then the specified function can be evaluated as nBitsParamSlot (1) = f b (15-3 + 1-7) = 3 bits. In this case, the field âbsDiffParamSlot [1]â 1305 may be represented by 3 bits.
ÐÑли знаÑение, пÑедÑÑавленное 3 биÑами, Ñавно 3, Ñо âbsParamSlot[1]â ÑÑановиÑÑÑ ÑавнÑм 7+3=10. СледоваÑелÑно, nBitsParamSlot(2)=fb(15-3+2-10)=2 биÑа. Ð ÑÑом ÑлÑÑае поле âbsDiffParamSlot[2]â 1305 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено 2 биÑами. ÐÑли колиÑеÑÑво оÑÑавÑÐ¸Ñ ÑÑ Ð²ÑеменнÑÑ Ð¸Ð½ÑеÑвалов Ñавно колиÑеÑÑÐ²Ñ Ð¾ÑÑавÑÐ¸Ñ ÑÑ Ð½Ð°Ð±Ð¾Ñов паÑамеÑÑов, Ñо Ð´Ð»Ñ Ð¿Ð¾Ð»Ñ âbsDiffParamSlot[ps]â Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²Ñделено 0 биÑ. ÐÑÑгими Ñловами, Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð²Ñеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð´Ð°Ð½Ð½Ñй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, дополниÑелÑÐ½Ð°Ñ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð½Ðµ ÑÑебÑеÑÑÑ.If the value represented by 3 bits is 3, then âbsParamSlot [1]â becomes 7 + 3 = 10. Therefore, nBitsParamSlot (2) = f b (15-3 + 2-10) = 2 bits. In this case, the field âbsDiffParamSlot [2]â 1305 may be represented by 2 bits. If the number of remaining time intervals is equal to the number of remaining parameter sets, then 0 bits can be allocated for the âbsDiffParamSlot [ps]â field. In other words, additional information is not required to represent the position of the time interval for which this set of parameters is applied.
Таким обÑазом, колиÑеÑÑво Ð±Ð¸Ñ Ð´Ð»Ñ âbsParamSlot[ps]â Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑинÑÑо пеÑеменнÑм. ÐолиÑеÑÑво Ð±Ð¸Ñ Ð´Ð»Ñ âbsParamSlot[ps]â Ð¼Ð¾Ð¶ÐµÑ ÑÑиÑÑваÑÑÑÑ Ð¸Ð· биÑового поÑока Ñ Ð¸ÑполÑзованием ÑÑнкÑии fb(x) в декодеÑе. РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ ÑÑнкÑÐ¸Ñ fb(x) Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ ÑÑнкÑÐ¸Ñ ceil(log2(x)).Thus, the number of bits for âbsParamSlot [ps]â can be accepted as a variable. The number of bits for âbsParamSlot [ps]â can be read from the bitstream using the f b (x) function in the decoder. In some embodiments, the function f b (x) may include the function ceil (log 2 (x)).
ÐÑи ÑÑиÑÑвании инÑоÑмаÑии Ð´Ð»Ñ âbsParamSlot[ps]â, пÑедÑÑавленной в виде абÑолÑÑного знаÑÐµÐ½Ð¸Ñ Ð¸ знаÑÐµÐ½Ð¸Ñ ÑазноÑÑи, из биÑового поÑока в декодеÑе ÑнаÑала из биÑового поÑока Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ ÑÑиÑан âbsParamSlot[0]â, а заÑем Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ ÑÑиÑан âbsDiffParamSlot[ps]â Ð´Ð»Ñ 0<ps<numParamSets. ÐаÑем можно найÑи âbsParamSlot[ps]â Ð´Ð»Ñ Ð¸Ð½ÑеÑвала 0â¤ps<numParamSets Ñ Ð¸ÑполÑзованием âbsParamSlot[0]â и âbsDiffParamSlot[ps]â. ÐапÑимеÑ, как показано на Ñиг. 13Ð, âbsParamSlot[ps]â можно найÑи, добавив âbsParamSlot[ps-1]â к âbsDiffParamSlot[ps]+1â.When reading the information for âbsParamSlot [ps]â, presented as an absolute value and a difference value, âbsParamSlot [0]â can be read from the bit stream first from the bit stream and then âbsDiffParamSlot [ps]â can be read for 0 <ps <numParamSets. Then you can find âbsParamSlot [ps]â for the interval 0â¤ps <numParamSets using âbsParamSlot [0]â and âbsDiffParamSlot [ps]â. For example, as shown in FIG. 13B, âbsParamSlot [ps]â can be found by adding âbsParamSlot [ps-1]â to âbsDiffParamSlot [ps] +1â.
Ðа Ñиг. 13С показан ÑинÑакÑÐ¸Ñ Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¸Ð½ÑоÑмаÑии о положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, в виде гÑÑÐ¿Ð¿Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. Ð ÑлÑÑае когда ÑÑÑеÑÑвÑÐµÑ Ð¼Ð½Ð¾Ð¶ÐµÑÑво набоÑов паÑамеÑÑов, множеÑÑво âbsParamSlotsâ 1307 Ð´Ð»Ñ Ð¼Ð½Ð¾Ð¶ÐµÑÑва набоÑов паÑамеÑÑов Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено по менÑÑей меÑе одной или неÑколÑкими гÑÑппами.In FIG. 13C, a syntax for presenting position information of a time interval for which a set of parameters is applied is shown as a group according to one embodiment of the present invention. In the case where there are multiple parameter sets, the multiple âbsParamSlotsâ 1307 for the multiple parameter sets may be represented by at least one or more groups.
ÐÑли колиÑеÑÑво âbsParamSlotsâ 1307 Ñавно (kN+L) и еÑли Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ âbsParamSlotsâ 1307 Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾ Q биÑ, Ñо âbsParamSlotsâ 1307 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено в виде ÑледÑÑÑей гÑÑппÑ. Ð ÑÑом ÑлÑÑае 'k' и 'N' ÑвлÑÑÑÑÑ Ð¿ÑоизволÑнÑми ÑелÑми ÑиÑлами, не ÑавнÑми нÑлÑ, а 'L' ÑвлÑеÑÑÑ Ð¿ÑоизволÑнÑм ÑелÑм ÑиÑлом, ÑдовлеÑвоÑÑÑÑим неÑавенÑÑÐ²Ñ 0â¤L<N.If the number of âbsParamSlotsâ 1307 is equal to (kN + L) and if Q bits are required to represent each âbsParamSlotsâ 1307, then âbsParamSlotsâ 1307 can be represented as the following group. In this case, 'k' and 'N' are arbitrary non-zero integers, and 'L' is an arbitrary integer satisfying the inequality 0â¤L <N.
ÐеÑод гÑÑппиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ñаги ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ k гÑÑпп пÑÑем ÑвÑзÑÐ²Ð°Ð½Ð¸Ñ N âbsParamSlotsâ 1307 и ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ Ð¿Ð¾Ñледней гÑÑÐ¿Ð¿Ñ Ð¿ÑÑем ÑвÑзÑÐ²Ð°Ð½Ð¸Ñ Ð¿Ð¾ÑÐ»ÐµÐ´Ð½Ð¸Ñ L âbsParamSlotsâ 1307. k гÑÑпп могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ M биÑами, а поÑледнÑÑ Ð³ÑÑппа Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена p биÑами. Ð ÑÑом ÑлÑÑае пÑедпоÑÑиÑелÑно, ÑÑÐ¾Ð±Ñ M Ð±Ð¸Ñ Ð±Ñло менÑÑе N·Q биÑ, иÑполÑзÑемÑÑ Ð² ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ из âbsParamSlotsâ 1307 без Ð¸Ñ Ð³ÑÑппиÑованиÑ. p Ð±Ð¸Ñ Ð¿ÑедпоÑÑиÑелÑно менÑÑе или Ñавно L·Q биÑ, иÑполÑзÑемÑÑ Ð² ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ âbsParamSlotsâ 1307 без Ð¸Ñ Ð³ÑÑппиÑованиÑ.The grouping method may include the steps of creating k groups by linking N âbsParamSlotsâ 1307 and creating the last group by linking the last L âbsParamSlotsâ 1307. k groups can be represented by M bits, and the last group can be represented by p bits. In this case, it is preferable that the M bits be less than the N · Q bits used in the case of representing each of the âbsParamSlotsâ 1307 without grouping them. The p bit is preferably less than or equal to the L · Q bit used in the case of representing each âbsParamSlotsâ 1307 without grouping them.
ÐÑедположим, напÑимеÑ, ÑÑо паÑа âbsParamSlotsâ 1307 Ð´Ð»Ñ Ð´Ð²ÑÑ Ð½Ð°Ð±Ð¾Ñов паÑамеÑÑов пÑедÑÑавлÑÐµÑ Ñобой d1 и d2 ÑооÑвеÑÑÑвенно. ÐÑли ÐºÐ°Ð¶Ð´Ð°Ñ Ð¸Ð· велиÑин d1 и d2 Ð¼Ð¾Ð¶ÐµÑ Ð¸Ð¼ÐµÑÑ Ð¿ÑÑÑ Ð·Ð½Ð°Ñений, Ñо Ð´Ð»Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹ из велиÑин d1 и d2 Ð½ÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð¾ имеÑÑ 3 биÑа. Ð ÑÑом ÑлÑÑае Ñ Ð¾ÑÑ 3 биÑами можно пÑедÑÑавиÑÑ Ð²Ð¾ÑÐµÐ¼Ñ Ð·Ð½Ð°Ñений, ÑакÑиÑеÑки поÑÑебÑеÑÑÑ Ð¿ÑÑÑ Ð·Ð½Ð°Ñений. То еÑÑÑ ÐºÐ°Ð¶Ð´Ð°Ñ Ð¸Ð· велиÑин d1 и d2 Ð¸Ð¼ÐµÐµÑ ÑÑи избÑÑоÑнÑÑ Ð·Ð½Ð°ÑениÑ. ÐÑоме Ñого, в ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ d1 и d2 в виде гÑÑÐ¿Ð¿Ñ Ð¿ÑÑем ÑвÑзÑÐ²Ð°Ð½Ð¸Ñ d1 и d2 вмеÑÑе, вмеÑÑо 6 Ð±Ð¸Ñ (=3 биÑа+3 биÑа) можно иÑполÑзоваÑÑ 5 биÑ. Ð ÑаÑÑноÑÑи, поÑколÑÐºÑ Ð²Ñе комбинаÑии d1 и d2 вклÑÑаÑÑ Ð² ÑÐµÐ±Ñ 25 (=5·5) Ñипов, гÑÑппа из d1 и d2 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена ÑолÑко 5 биÑами. ÐоÑколÑÐºÑ 5 Ð±Ð¸Ñ Ð¼Ð¾Ð³ÑÑ Ð¿ÑедÑÑавлÑÑÑ 32 знаÑениÑ, в ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð² виде гÑÑÐ¿Ð¿Ñ ÑоздаеÑÑÑ ÑÐµÐ¼Ñ Ð¸Ð·Ð±ÑÑоÑнÑÑ Ð·Ð½Ð°Ñений. ÐÑоме Ñого, в ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¿ÑÑем гÑÑппиÑÐ¾Ð²Ð°Ð½Ð¸Ñ d1 и d2 избÑÑоÑноÑÑÑ Ð¿Ð¾Ð»ÑÑаеÑÑÑ Ð¼ÐµÐ½ÑÑей, Ñем в ÑлÑÑае пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ°Ð¶Ð´Ð¾Ð¹ из велиÑин d1 и d2 в виде 3 биÑ.Suppose, for example, that the pair âbsParamSlotsâ 1307 for two sets of parameters is d1 and d2, respectively. If each of the values of d1 and d2 can have five values, then to represent each of the values of d1 and d2 it is necessary to have 3 bits. In this case, although eight values can be represented in 3 bits, five values are actually required. That is, each of the quantities d1 and d2 has three redundant values. In addition, if d1 and d2 are represented as a group by linking d1 and d2 together, instead of 6 bits (= 3 bits + 3 bits), 5 bits can be used. In particular, since all combinations of d1 and d2 include 25 (= 5 · 5) types, a group of d1 and d2 can only be represented by 5 bits. Since 5 bits can represent 32 values, when presented as a group, seven redundant values are created. In addition, in the case of representing by grouping d1 and d2, the redundancy is less than in the case of representing each of the values of d1 and d2 as 3 bits.
ÐÑи конÑигÑÑиÑовании гÑÑÐ¿Ð¿Ñ Ð´Ð°Ð½Ð½Ñе Ð´Ð»Ñ Ð³ÑÑÐ¿Ð¿Ñ Ð¼Ð¾Ð¶Ð½Ð¾ ÑконÑигÑÑиÑоваÑÑ, иÑполÑзÑÑ âbsParamSlot[0]â Ð´Ð»Ñ Ð½Ð°ÑалÑного знаÑÐµÐ½Ð¸Ñ Ð¸ знаÑение ÑазноÑÑи Ð¼ÐµÐ¶Ð´Ñ Ð¿Ð°Ñами âbsParamSlot[ps]â Ð´Ð»Ñ Ð²ÑоÑого или поÑледÑÑÑего знаÑениÑ.When configuring a group, the data for the group can be configured using âbsParamSlot [0]â for the initial value and the difference between the pairs âbsParamSlot [ps]â for the second or subsequent value.
ÐÑи конÑигÑÑиÑовании гÑÑÐ¿Ð¿Ñ Ð±Ð¸ÑÑ Ð¼Ð¾Ð¶Ð½Ð¾ ÑаÑпÑеделÑÑÑ Ð½ÐµÐ¿Ð¾ÑÑедÑÑвенно без гÑÑппиÑованиÑ, еÑли колиÑеÑÑво набоÑов паÑамеÑÑов Ñавно 1, и биÑÑ Ð¼Ð¾Ð¶Ð½Ð¾ ÑаÑпÑеделÑÑÑ Ð¿Ð¾Ñле завеÑÑÐµÐ½Ð¸Ñ Ð³ÑÑппиÑованиÑ, еÑли колиÑеÑÑво набоÑов паÑамеÑÑов болÑÑе или Ñавно 2.When configuring a group, bits can be allocated directly without grouping if the number of parameter sets is 1, and bits can be distributed after grouping is completed if the number of parameter sets is greater than or equal to 2.
Ðа Ñиг. 14 пÑедÑÑавлена блок-ÑÑ ÐµÐ¼Ð° ÑпоÑоба кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. Ðалее ÑазÑÑÑнÑеÑÑÑ ÑпоÑоб кодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð°ÑдиоÑигнала и ÑÑнкÑиониÑование кодеÑа ÑоглаÑно наÑÑоÑÑÐµÐ¼Ñ Ð¸Ð·Ð¾Ð±ÑеÑениÑ.In FIG. 14 is a flowchart of an encoding method according to one embodiment of the present invention. The following explains the encoding method of the audio signal and the operation of the encoder according to the present invention.
СнаÑала (S1401) опÑеделÑеÑÑÑ Ð¾Ð±Ñее колиÑеÑÑво вÑеменнÑÑ Ð¸Ð½ÑеÑвалов (numSlots) в одном пÑоÑÑÑанÑÑвенном кадÑе и обÑее колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² (numBands) аÑдиоÑигнала.First, (S1401), the total number of time slots (numSlots) in one spatial frame and the total number of parametric ranges (numBands) of the audio signal are determined.
ÐаÑем (S1402) опÑеделÑеÑÑÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð¼Ð¾Ð´ÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² (блок OTT и/или блок TTT), и/или оÑÑаÑоÑнÑй Ñигнал.Then (S1402), the number of parametric ranges used for the channel conversion module (OTT block and / or TTT block) and / or the residual signal are determined.
ÐÑли блок OTT Ð¸Ð¼ÐµÐµÑ Ñежим канала LFE, Ñо оÑделÑно опÑеделÑÑÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° OTT.If the OTT block has an LFE channel mode, then the number of parametric ranges used for the OTT block is separately determined.
ÐÑли блок OTT не Ð¸Ð¼ÐµÐµÑ Ñежима канала LFE, Ñо в каÑеÑÑве колиÑеÑÑва паÑамеÑÑов, пÑименÑемÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° OTT, иÑполÑзÑÑÑ ânumBandsâ.If the OTT block does not have the LFE channel mode, then ânumBandsâ is used as the number of parameters used for the OTT block.
Ðалее опÑеделÑеÑÑÑ Ñип пÑоÑÑÑанÑÑвенного кадÑа. Ð ÑÑом ÑлÑÑае пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¾ÑнеÑен к кадÑÑ ÑикÑиÑованного Ñипа или кадÑÑ Ð¿ÐµÑеменного Ñипа.Next, the type of spatial frame is determined. In this case, the spatial frame may be assigned to a frame of a fixed type or a frame of variable type.
ÐÑли пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ Ð¾ÑноÑиÑÑÑ Ðº пеÑÐµÐ¼ÐµÐ½Ð½Ð¾Ð¼Ñ ÑÐ¸Ð¿Ñ (S1403), Ñо опÑеделÑеÑÑÑ (S1406) колиÑеÑÑво набоÑов паÑамеÑÑов, иÑполÑзÑемÑÑ Ð² одном пÑоÑÑÑанÑÑвенном кадÑе. Ð ÑÑом ÑлÑÑае Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¸ÑполÑзован Ð´Ð»Ñ Ð¼Ð¾Ð´ÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² на каждом вÑеменном инÑеÑвале.If the spatial frame is of a variable type (S1403), then the number of parameter sets used in one spatial frame is determined (S1406). In this case, a set of parameters can be used for the channel conversion module at each time interval.
Ðалее (S1407) опÑеделÑÑÑ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ðµ вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð´Ð°Ð½Ð½Ñй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов. Ð ÑÑом ÑлÑÑае положение вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð´Ð°Ð½Ð½Ñй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено в виде абÑолÑÑного знаÑÐµÐ½Ð¸Ñ Ð¸ знаÑÐµÐ½Ð¸Ñ ÑазноÑÑи. ÐапÑимеÑ, положение вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð¿ÐµÑвÑй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено в виде абÑолÑÑного знаÑениÑ, а положение вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð²ÑоÑой или поÑледÑÑÑий Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено в виде знаÑÐµÐ½Ð¸Ñ ÑазноÑÑи оÑноÑиÑелÑно Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð¿ÑедÑдÑÑего вÑеменного инÑеÑвала. Ð ÑÑом ÑлÑÑае положение вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð´Ð°Ð½Ð½Ñй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено пеÑеменнÑм колиÑеÑÑвом биÑ.Next (S1407), the position of the time interval for which this set of parameters is applied is determined. In this case, the position of the time interval for which this set of parameters is applied can be represented as an absolute value and a difference value. For example, the position of the time interval for which the first set of parameters is applied can be represented as an absolute value, and the position of the time interval for which the second or subsequent set of parameters is applied can be represented as the difference value relative to the position of the previous time interval. In this case, the position of the time interval for which this set of parameters is applied can be represented by a variable number of bits.
Ð ÑаÑÑноÑÑи, положение вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð¿ÐµÑвÑй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено колиÑеÑÑвом биÑ, вÑÑиÑлÑемÑÑ Ñ Ð¸ÑполÑзованием обÑего колиÑеÑÑва вÑеменнÑÑ Ð¸Ð½ÑеÑвалов и обÑего колиÑеÑÑва набоÑов паÑамеÑÑов. Ðоложение вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð²ÑоÑой или поÑледÑÑÑий Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлено колиÑеÑÑвом биÑ, вÑÑиÑлÑемÑм Ñ Ð¸ÑполÑзованием обÑего колиÑеÑÑва вÑеменнÑÑ Ð¸Ð½ÑеÑвалов, обÑего колиÑеÑÑва набоÑов паÑамеÑÑов и Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð²Ñеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð¿ÑедÑдÑÑий Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов.In particular, the position of the time interval for which the first set of parameters is applied can be represented by the number of bits computed using the total number of time intervals and the total number of parameter sets. The position of the time interval for which the second or subsequent set of parameters is applied may be represented by the number of bits calculated using the total number of time intervals, the total number of parameter sets and the position of the time interval for which the previous parameter set is applied.
ÐÑли пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ Ð¾ÑноÑиÑÑÑ Ðº ÑикÑиÑÐ¾Ð²Ð°Ð½Ð½Ð¾Ð¼Ñ ÑипÑ, Ñо опÑеделÑеÑÑÑ (S1404) колиÑеÑÑво набоÑов паÑамеÑÑов, иÑполÑзÑемÑÑ Ð² одном пÑоÑÑÑанÑÑвенном кадÑе. Ð ÑÑом ÑлÑÑае положение вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð´Ð°Ð½Ð½Ñй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, вÑбиÑаÑÑ Ñ Ð¸ÑполÑзованием заÑанее ÑÑÑановленного пÑавила. ÐапÑимеÑ, положение вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¾Ð¿Ñеделено Ñаким обÑазом, ÑÑÐ¾Ð±Ñ Ð¾Ð½ Ð½Ð°Ñ Ð¾Ð´Ð¸Ð»ÑÑ Ð½Ð° Ñавном ÑаÑÑÑоÑнии Ð¾Ñ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð²Ñеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð¿ÑедÑдÑÑий Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов (S1405).If the spatial frame is of a fixed type, then the number of parameter sets used in one spatial frame is determined (S1404). In this case, the position of the time interval for which this set of parameters is applied is selected using a predetermined rule. For example, the position of the time interval for which the parameter set is applied can be determined so that it is at an equal distance from the position of the time interval for which the previous parameter set is applied (S1405).
Ðалее блок понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ блок ÑÐ¾Ð·Ð´Ð°Ð½Ð¸Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑии ÑоздаÑÑ Ñигнал поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ пÑоÑÑÑанÑÑвеннÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ ÑооÑвеÑÑÑвенно, иÑполÑзÑÑ Ð¾Ð¿Ñеделенное вÑÑе обÑее колиÑеÑÑво вÑеменнÑÑ Ð¸Ð½ÑеÑвалов, обÑее колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², колиÑеÑÑво паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ð±Ð»Ð¾ÐºÐ° пÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð°, обÑее колиÑеÑÑво набоÑов паÑамеÑÑов в одном пÑоÑÑÑанÑÑвенном кадÑе и инÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов (S1408).Next, the downmix block and the spatial information creation block create a signal after downmix and spatial information, respectively, using the total number of time intervals defined above, the total number of parametric ranges, the number of parametric ranges used for the channel transform block, the total number of parameter sets in one spatial frame and information about the position of the time interval for which the set of parameters is applied (S1408).
ÐаконеÑ, блок мÑлÑÑиплекÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑÐ¾Ð·Ð´Ð°ÐµÑ Ð±Ð¸ÑовÑй поÑок, вклÑÑаÑÑий в ÑÐµÐ±Ñ Ñигнал поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ пÑоÑÑÑанÑÑвеннÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ (S1409), а заÑем пеÑÐµÐ´Ð°ÐµÑ ÑозданнÑй биÑовÑй поÑок в Ð´ÐµÐºÐ¾Ð´ÐµÑ (S1409).Finally, the multiplexing unit creates a bit stream including a signal after down-mixing and spatial information (S1409), and then transfers the created bit stream to a decoder (S1409).
Ðа Ñиг. 15 пÑедÑÑавлена блок-ÑÑ ÐµÐ¼Ð° ÑпоÑоба декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑоглаÑно Ð¾Ð´Ð½Ð¾Ð¼Ñ Ð²Ð°ÑианÑÑ Ð½Ð°ÑÑоÑÑего изобÑеÑениÑ. СпоÑоб декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð°ÑдиоÑигнала и ÑÑнкÑиониÑование декодеÑа ÑоглаÑно наÑÑоÑÑÐµÐ¼Ñ Ð¸Ð·Ð¾Ð±ÑеÑÐµÐ½Ð¸Ñ Ð¿Ð¾ÑÑнÑÑÑÑÑ Ð½Ð¸Ð¶Ðµ.In FIG. 15 is a flowchart of a decoding method according to one embodiment of the present invention. An audio decoding method and the operation of a decoder according to the present invention are explained below.
СнаÑала Ð´ÐµÐºÐ¾Ð´ÐµÑ Ð¿ÑÐ¸Ð½Ð¸Ð¼Ð°ÐµÑ Ð±Ð¸ÑовÑй поÑок аÑдиоÑигнала (S1501). Ðлок демÑлÑÑиплекÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð²ÑделÑÐµÑ Ñигнал поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¸ Ñигнал Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией из полÑÑенного биÑового поÑока (S1502). Ðалее блок декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ñигнала Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией Ð¸Ð·Ð²Ð»ÐµÐºÐ°ÐµÑ Ð¸Ð· инÑоÑмаÑии о конÑигÑÑаÑии Ñигнала Ñ Ð¿ÑоÑÑÑанÑÑвенной инÑоÑмаÑией инÑоÑмаÑÐ¸Ñ Ð¾Ð± обÑем колиÑеÑÑве вÑеменнÑÑ Ð¸Ð½ÑеÑвалов в одном пÑоÑÑÑанÑÑвенном кадÑе, обÑем колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð² и колиÑеÑÑве паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемом Ð´Ð»Ñ Ð¼Ð¾Ð´ÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð² (S1503).First, the decoder receives the bitstream of the audio signal (S1501). The demultiplexing unit extracts the signal after down-mixing and the spatial information signal from the obtained bit stream (S1502). Next, the spatial information signal decoding unit extracts from the configuration information of the spatial information signal information on the total number of time intervals in one spatial frame, the total number of parametric ranges and the number of parametric ranges used for the channel conversion module (S1503).
ÐÑли пÑоÑÑÑанÑÑвеннÑй ÐºÐ°Ð´Ñ Ð¾ÑноÑиÑÑÑ Ðº пеÑÐµÐ¼ÐµÐ½Ð½Ð¾Ð¼Ñ ÑÐ¸Ð¿Ñ (S1504), из пÑоÑÑÑанÑÑвенного кадÑа извлекаеÑÑÑ ÐºÐ¾Ð»Ð¸ÑеÑÑво набоÑов паÑамеÑÑов в одном пÑоÑÑÑанÑÑвенном кадÑе и инÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð´Ð°Ð½Ð½Ñй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов (S1505). ÐнÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменного инÑеÑвала Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена ÑикÑиÑованнÑм или пеÑеменнÑм колиÑеÑÑвом биÑ. Ð ÑÑом ÑлÑÑае инÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð¿ÐµÑвÑй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена в виде абÑолÑÑного знаÑениÑ, а инÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменнÑÑ Ð¸Ð½ÑеÑвалов, Ð´Ð»Ñ ÐºÐ¾ÑоÑÑÑ Ð¿ÑименÑÑÑÑÑ Ð²ÑоÑой или поÑледÑÑÑий набоÑÑ Ð¿Ð°ÑамеÑÑов, Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¿ÑедÑÑавлена в виде знаÑÐµÐ½Ð¸Ñ ÑазноÑÑи. ÐейÑÑвиÑелÑнÑÑ Ð¸Ð½ÑоÑмаÑÐ¸Ñ Ð¾ положении вÑеменнÑÑ Ð¸Ð½ÑеÑвалов, Ð´Ð»Ñ ÐºÐ¾ÑоÑÑÑ Ð¿ÑименÑÑÑÑÑ Ð²ÑоÑой или поÑледÑÑÑие набоÑÑ Ð¿Ð°ÑамеÑÑов, можно найÑи пÑÑем Ð´Ð¾Ð±Ð°Ð²Ð»ÐµÐ½Ð¸Ñ Ð·Ð½Ð°ÑÐµÐ½Ð¸Ñ ÑазноÑÑи к инÑоÑмаÑии о положении вÑеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð¿ÑедÑдÑÑий Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов.If the spatial frame is of a variable type (S1504), the number of parameter sets in one spatial frame and information about the position of the time interval for which this set of parameters is applied is extracted from the spatial frame (S1505). Information about the position of the time interval can be represented by a fixed or variable number of bits. In this case, information about the position of the time interval for which the first set of parameters is applied can be presented in the form of an absolute value, and information about the position of the time intervals for which the second or subsequent sets of parameters are applied can be represented as the difference value. Valid information about the position of the time intervals for which the second or subsequent sets of parameters are applied can be found by adding the difference value to the information about the position of the time interval for which the previous set of parameters is applied.
ÐаконеÑ, Ñигнал поÑле понижаÑÑего микÑиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð¿ÑеобÑазÑеÑÑÑ Ð² многоканалÑнÑй аÑдиоÑигнал Ñ Ð¸ÑполÑзованием извлеÑенной инÑоÑмаÑии (S1506).Finally, the signal after down-mixing is converted to a multi-channel audio signal using the extracted information (S1506).
ÐÑÑеопиÑаннÑе ÑаÑкÑÑÑÑе ваÑианÑÑ Ð¸Ð·Ð¾Ð±ÑеÑÐµÐ½Ð¸Ñ Ð¾Ð±ÐµÑпеÑиваÑÑ ÑÑд пÑеимÑÑеÑÑв по ÑÑÐ°Ð²Ð½ÐµÐ½Ð¸Ñ Ñо ÑÑандаÑÑнÑми ÑÑ ÐµÐ¼Ð°Ð¼Ð¸ аÑдиокодиÑованиÑ.The above disclosed embodiments of the invention provide a number of advantages over standard audio coding schemes.
Ðо-пеÑвÑÑ , пÑи кодиÑовании многоканалÑного аÑдиоÑигнала пÑÑем пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð²Ñеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, Ñ Ð¿Ð¾Ð¼Ð¾ÑÑÑ Ð¿ÐµÑеменного колиÑеÑÑва Ð±Ð¸Ñ Ð² ÑаÑкÑÑÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð¸Ð·Ð¾Ð±ÑеÑÐµÐ½Ð¸Ñ Ð²Ð¾Ð·Ð¼Ð¾Ð¶Ð½Ð¾ ÑменÑÑение обÑема пеÑедаваемÑÑ Ð´Ð°Ð½Ð½ÑÑ .First, when encoding a multi-channel audio signal by presenting the position of a time interval for which a set of parameters is applied, using a variable number of bits in the disclosed embodiments of the invention, it is possible to reduce the amount of transmitted data.
Ðо-вÑоÑÑÑ , пÑÑем пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð²Ñеменного инÑеÑвала, Ð´Ð»Ñ ÐºÐ¾ÑоÑого пÑименÑеÑÑÑ Ð¿ÐµÑвÑй Ð½Ð°Ð±Ð¾Ñ Ð¿Ð°ÑамеÑÑов, в виде абÑолÑÑного знаÑÐµÐ½Ð¸Ñ Ð¸ пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ð¹ вÑеменнÑÑ Ð¸Ð½ÑеÑвалов, Ð´Ð»Ñ ÐºÐ¾ÑоÑÑÑ Ð¿ÑименÑÑÑÑÑ Ð²ÑоÑой или поÑледÑÑÑий набоÑÑ Ð¿Ð°ÑамеÑÑов, в виде знаÑÐµÐ½Ð¸Ñ ÑазноÑÑи в ÑаÑкÑÑÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð¸Ð·Ð¾Ð±ÑеÑÐµÐ½Ð¸Ñ Ð¼Ð¾Ð¶Ð½Ð¾ ÑменÑÑиÑÑ Ð¾Ð±Ñем пеÑедаваемÑÑ Ð´Ð°Ð½Ð½ÑÑ .Secondly, by representing the position of the time interval for which the first set of parameters is applied, in the form of an absolute value and presenting the positions of the time intervals for which the second or subsequent sets of parameters are applied, as the difference value in the disclosed embodiments of the invention, the amount of transmitted data can be reduced.
Ð-ÑÑеÑÑÐ¸Ñ , пÑÑем пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð², пÑименÑемÑÑ Ð´Ð»Ñ Ñказанного модÑÐ»Ñ Ð¿ÑеобÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÐºÐ°Ð½Ð°Ð»Ð¾Ð², в виде блока OTT и/или блока TTT Ñ Ð¿Ð¾Ð¼Ð¾ÑÑÑ ÑикÑиÑованного или пеÑеменного колиÑеÑÑва Ð±Ð¸Ñ Ð² ÑаÑкÑÑÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð¸Ð·Ð¾Ð±ÑеÑÐµÐ½Ð¸Ñ Ð¼Ð¾Ð¶Ð½Ð¾ ÑменÑÑиÑÑ Ð¾Ð±Ñем пеÑедаваемÑÑ Ð´Ð°Ð½Ð½ÑÑ . Ð ÑÑом ÑлÑÑае Ð¿Ð¾Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ Ð²ÑеменнÑÑ Ð¸Ð½ÑеÑвалов, Ð´Ð»Ñ ÐºÐ¾ÑоÑÑÑ Ð¿ÑименÑÑÑÑÑ Ð½Ð°Ð±Ð¾ÑÑ Ð¿Ð°ÑамеÑÑов, могÑÑ Ð±ÑÑÑ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ Ñ Ð¸ÑполÑзованием обÑÑжденного вÑÑе пÑинÑипа, где набоÑÑ Ð¿Ð°ÑамеÑÑов могÑÑ Ð½Ð°Ñ Ð¾Ð´Ð¸ÑÑÑÑ Ð² ÑÐ°Ð¼ÐºÐ°Ñ ÐºÐ¾Ð»Ð¸ÑеÑÑва паÑамеÑÑиÑеÑÐºÐ¸Ñ Ð´Ð¸Ð°Ð¿Ð°Ð·Ð¾Ð½Ð¾Ð².Thirdly, by representing the number of parametric ranges used for the specified channel conversion module as an OTT block and / or TTT block using a fixed or variable number of bits in the disclosed embodiments of the invention, the amount of transmitted data can be reduced. In this case, the positions of the time intervals for which the parameter sets are applied can be represented using the principle discussed above, where the parameter sets can be within the number of parametric ranges.
Ðа Ñиг. 16 пÑедÑÑавлена блок-ÑÑ ÐµÐ¼Ð° пÑимеÑной аÑÑ Ð¸ÑекÑÑÑÑ 1600 ÑÑÑÑойÑÑва Ð´Ð»Ñ ÑеализаÑии аÑдиокодеÑа/декодеÑа, опиÑаннÑÑ Ñо ÑÑÑлками на ÑигÑÑÑ 1-15. ÐÑÑ Ð¸ÑекÑÑÑа 1600 ÑÑÑÑойÑÑва пÑименима Ð´Ð»Ñ Ð¼Ð½Ð¾Ð¶ÐµÑÑва ÑазлиÑнÑÑ ÑÑÑÑойÑÑв, вклÑÑаÑÑÐ¸Ñ Ð² ÑебÑ, но не ÑолÑко: пеÑÑоналÑнÑе компÑÑÑеÑÑ, компÑÑÑеÑÑ-ÑеÑвеÑÑ, полÑзоваÑелÑÑкие ÑлекÑÑоннÑе ÑÑÑÑойÑÑва, мобилÑнÑе ÑелеÑонÑ, пеÑÑоналÑнÑе ÑиÑÑовÑе помоÑники (PDA), ÑлекÑÑоннÑе планÑеÑÑ, ÑелевизионнÑе ÑиÑÑемÑ, ÑелевизионнÑе пÑиÑÑавки, игÑовÑе пÑиÑÑавки, медиаплееÑÑ, мÑзÑкалÑнÑе плееÑÑ, навигаÑионнÑе ÑиÑÑÐµÐ¼Ñ Ð¸Ð»Ð¸ лÑбое дÑÑгое ÑÑÑÑойÑÑво, ÑпоÑобное декодиÑоваÑÑ Ð°ÑдиоÑигналÑ. РнекоÑоÑÑÑ Ð¸Ð· ÑÑÐ¸Ñ ÑÑÑÑойÑÑв Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ñеализована модиÑиÑиÑÐ¾Ð²Ð°Ð½Ð½Ð°Ñ Ð°ÑÑ Ð¸ÑекÑÑÑа, где иÑполÑзÑеÑÑÑ ÐºÐ¾Ð¼Ð±Ð¸Ð½Ð°ÑÐ¸Ñ Ð°Ð¿Ð¿Ð°ÑаÑнÑÑ Ð¸ пÑогÑаммнÑÑ ÑÑедÑÑв.In FIG. 16 is a block diagram of an example architecture 1600 of an apparatus for implementing an audio encoder / decoder described with reference to FIGS. 1-15. The device architecture 1600 is applicable to many different devices, including, but not limited to: personal computers, server computers, user electronic devices, mobile phones, personal digital assistants (PDAs), electronic tablets, television systems, set-top boxes, game consoles, media players, music players, navigation systems, or any other device capable of decoding audio signals. Some of these devices may have a modified architecture that uses a combination of hardware and software.
ÐÑÑ Ð¸ÑекÑÑÑа 1600 вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¾Ð´Ð¸Ð½ или неÑколÑко пÑоÑеÑÑоÑов 1602 (напÑимеÑ, PowerPC®, Intel Pentium® 4 и Ñ.д.), одно или неÑколÑко ÑÑÑÑойÑÑв 1604 оÑобÑÐ°Ð¶ÐµÐ½Ð¸Ñ (напÑимеÑ, ÑлекÑÑонно-лÑÑÐµÐ²Ð°Ñ ÑÑÑбка (CRT), жидкокÑиÑÑаллиÑеÑкий диÑплей (LCD)), аÑдиоподÑиÑÑÐµÐ¼Ñ 1606 (напÑимеÑ, аппаÑаÑнÑе/пÑогÑаммнÑе аÑдиоÑÑедÑÑва), один или неÑколÑко ÑеÑевÑÑ Ð¸Ð½ÑеÑÑейÑов 1608 (напÑимеÑ, Ethernet, FireWire®, Ñина USB и Ñ.д.), ÑÑÑÑойÑÑва 1610 ввода (напÑимеÑ, клавиаÑÑÑа, мÑÑÑ Ð¸ Ñ.д.) и один или неÑколÑко ÑÑиÑÑваемÑÑ ÐºÐ¾Ð¼Ð¿ÑÑÑеÑом ноÑиÑелей 1612 (напÑимеÑ, ÐÐУ (RAM), ÐÐУ (ROM), ÑÐ¸Ð½Ñ Ñонное динамиÑеÑкое ÐÐУ (SDRAM), жеÑÑкий диÑк, опÑиÑеÑкий диÑк, ÑлеÑ-памÑÑÑ Ð¸ Ñ.д.). ÐÑи компоненÑÑ Ð¼Ð¾Ð³ÑÑ Ð¾Ð±Ð¼ÐµÐ½Ð¸Ð²Ð°ÑÑÑÑ ÑообÑениÑми и даннÑми ÑеÑез Ð¾Ð´Ð½Ñ Ð¸Ð»Ð¸ неÑколÑко Ñин 1614 (напÑимеÑ, ÑÑандаÑÑов EISA, PCI, PCI Express и Ñ.д.). Architecture 1600 includes one or more processors 1602 (e.g., PowerPC®, Intel Pentium® 4, etc.), one or more display devices 1604 (eg, a cathode ray tube (CRT), liquid crystal display (LCD)) , an audio subsystem 1606 (e.g., hardware / software audio), one or more network interfaces 1608 (e.g., Ethernet, FireWire®, USB bus, etc.), input devices 1610 (e.g., keyboard, mouse, etc.) and one or more computer-readable media 1612 (e.g., RAM, ROM, synchronous dynamic RAM (SDRAM), hard th disk, optical disk, flash memory, etc.). These components can exchange messages and data through one or more buses 1614 (for example, standards EISA, PCI, PCI Express, etc.).
ТеÑмин âÑÑиÑÑваемÑй компÑÑÑеÑом ноÑиÑелÑâ оÑноÑиÑÑÑ Ðº лÑÐ±Ð¾Ð¼Ñ Ð½Ð¾ÑиÑелÑ, коÑоÑÑй ÑÑаÑÑвÑÐµÑ Ð² обеÑпеÑении пÑоÑеÑÑоÑа 1602 командами Ð´Ð»Ñ Ð¸Ñ Ð¸ÑполнениÑ, в Ñом ÑиÑле, но не ÑолÑко: ÑнеÑгонезавиÑимÑе ноÑиÑели (напÑимеÑ, опÑиÑеÑкие или магниÑнÑе диÑки), ÑнеÑгозавиÑимÑе ноÑиÑели (напÑимеÑ, памÑÑÑ) и ÑÑÐµÐ´Ñ Ð¿ÐµÑедаÑи. СÑеда пеÑедаÑи вклÑÑÐ°ÐµÑ Ð² ÑебÑ, но не ÑолÑко, коакÑиалÑнÑе кабели, меднÑе пÑовода и опÑиÑеÑкое волокно. СÑеда пеÑедаÑи Ñакже Ð¼Ð¾Ð¶ÐµÑ ÑÑÑеÑÑвоваÑÑ Ð² виде акÑÑÑиÑеÑÐºÐ¸Ñ , ÑвеÑовÑÑ Ð¸Ð»Ð¸ ÑадиоÑаÑÑоÑнÑÑ Ð²Ð¾Ð»Ð½.The term âcomputer-readable mediumâ refers to any medium that participates in providing instructions to the processor 1602 for their execution, including, but not limited to: non-volatile media (eg, optical or magnetic disks), volatile media (eg, memory) and the environment transmission. The transmission medium includes, but not limited to, coaxial cables, copper wires, and optical fiber. The transmission medium may also exist in the form of acoustic, light or radio frequency waves.
СÑиÑÑваемÑй компÑÑÑеÑом ноÑиÑÐµÐ»Ñ 1612, кÑоме Ñого, вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ Ð¾Ð¿ÐµÑаÑионнÑÑ ÑиÑÑÐµÐ¼Ñ 1616 (напÑимеÑ, Mac OS®, Windows®, Linux и Ñ.д.), ÑеÑевой модÑÐ»Ñ 1618 ÑвÑзи, аÑдиокодек 1620 и одно или неÑколÑко пÑиложений 1622. ÐпеÑаÑÐ¸Ð¾Ð½Ð½Ð°Ñ ÑиÑÑема 1616 Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¼Ð½Ð¾Ð³Ð¾Ð¿Ð¾Ð»ÑзоваÑелÑÑкой, многопÑоÑеÑÑоÑной, многозадаÑной, многопоÑоÑной, имеÑÑ Ñежим ÑабоÑÑ Ð² ÑеалÑном вÑемени и Ñ.п. ÐпеÑаÑÐ¸Ð¾Ð½Ð½Ð°Ñ ÑиÑÑема 1616 вÑполнÑÐµÑ Ð±Ð°Ð·Ð¾Ð²Ñе задаÑи, в Ñом ÑиÑле, но не ÑолÑко: ÑаÑпознавание Ð²Ñ Ð¾Ð´Ð½ÑÑ Ð´Ð°Ð½Ð½ÑÑ , поÑÑÑпаÑÑÐ¸Ñ Ð¾Ñ ÑÑÑÑойÑÑв 1610 ввода; поÑÑÐ»ÐºÑ Ð²ÑÑ Ð¾Ð´Ð½ÑÑ Ð´Ð°Ð½Ð½ÑÑ Ð½Ð° ÑÑÑÑойÑÑва 1604 оÑобÑÐ°Ð¶ÐµÐ½Ð¸Ñ Ð¸ аÑдиоподÑиÑÑÐµÐ¼Ñ 1606; оÑÑлеживание Ñайлов и каÑалогов на ÑÑиÑÑваемÑÑ ÐºÐ¾Ð¼Ð¿ÑÑÑеÑом ноÑиÑелÑÑ 1612 (напÑимеÑ, памÑÑÑ Ð¸Ð»Ð¸ запоминаÑÑее ÑÑÑÑойÑÑво); ÑпÑавление пеÑиÑеÑийнÑми ÑÑÑÑойÑÑвами (напÑимеÑ, накопиÑели на диÑÐºÐ°Ñ , пÑинÑеÑÑ Ð¸ Ñ.д.); и ÑпÑавление ÑÑаÑиком по одной или неÑколÑким Ñинам 1614.Computer- readable media 1612 also includes an operating system 1616 (eg, Mac OS®, Windows®, Linux, etc.), a network communication module 1618, an audio codec 1620, and one or more applications 1622. The operating system 1616 may be multi-user, multi-processor, multi-tasking, multi-threaded, have a real-time mode of operation, etc. Operating system 1616 performs basic tasks, including, but not limited to: recognition of input data coming from input devices 1610; sending output to the display devices 1604 and the audio subsystem 1606; tracking files and directories on computer-readable media 1612 (e.g., memory or storage device); peripheral device management (for example, disk drives, printers, etc.); and traffic control on one or more buses 1614.
СеÑевой модÑÐ»Ñ 1618 ÑвÑзи вклÑÑÐ°ÐµÑ Ð² ÑÐµÐ±Ñ ÑазлиÑнÑе компоненÑÑ Ð´Ð»Ñ ÑÑÑановки и поддеÑжки ÑеÑевÑÑ Ñоединений (напÑимеÑ, пÑогÑаммнÑе ÑÑедÑÑва Ð´Ð»Ñ ÑеализаÑии пÑоÑоколов ÑвÑзи, ÑÐ°ÐºÐ¸Ñ ÐºÐ°Ðº TCP/IP, HTTP, Ethernet и Ñ.д.). СеÑевой модÑÐ»Ñ 1618 ÑвÑзи Ð¼Ð¾Ð¶ÐµÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð±ÑаÑзеÑ, пÑедоÑÑавлÑÑÑий опеÑаÑоÑам аÑÑ Ð¸ÑекÑÑÑÑ 1600 ÑÑÑÑойÑÑва возможноÑÑÑ Ð²ÐµÑÑи в ÑеÑи (напÑимеÑ, ÐнÑеÑнеÑ) поиÑк инÑоÑмаÑии (напÑимеÑ, аÑдиоконÑенÑа).The communication network module 1618 includes various components for establishing and maintaining network connections (for example, software for implementing communication protocols such as TCP / IP, HTTP, Ethernet, etc.). The communication network module 1618 may include a browser enabling device architecture operators 1600 to search for information (e.g., audio content) on the network (e.g., the Internet).
ÐÑдиокодек 1620 оÑвеÑÐ°ÐµÑ Ð·Ð° ÑеализаÑÐ¸Ñ Ð²ÑÐµÑ Ð¸Ð»Ð¸ ÑаÑÑи пÑоÑеÑÑов обÑабоÑки, ÑвÑзанной Ñ ÐºÐ¾Ð´Ð¸Ñованием и/или декодиÑованием и опиÑанной Ñо ÑÑÑлками на ÑигÑÑÑ 1-15. РнекоÑоÑÑÑ Ð²Ð°ÑианÑÐ°Ñ Ð°Ñдиокодек ÑабоÑÐ°ÐµÑ Ð²Ð¼ÐµÑÑе Ñ Ð°Ð¿Ð¿Ð°ÑаÑнÑми ÑÑедÑÑвами (напÑимеÑ, пÑоÑеÑÑÐ¾Ñ (пÑоÑеÑÑоÑÑ) 1602, аÑдиоподÑиÑÑема 1606) Ð´Ð»Ñ Ð¾Ð±ÑабоÑки аÑдиоÑигналов, вклÑÑÐ°Ñ ÐºÐ¾Ð´Ð¸Ñование и/или декодиÑование аÑдиоÑигналов, ÑоглаÑно опиÑÐ°Ð½Ð½Ð¾Ð¼Ñ Ð·Ð´ÐµÑÑ Ð½Ð°ÑÑоÑÑÐµÐ¼Ñ Ð¸Ð·Ð¾Ð±ÑеÑениÑ.The audio codec 1620 is responsible for implementing all or part of the processing processes associated with encoding and / or decoding and described with reference to figures 1-15. In some embodiments, the audio codec operates in conjunction with hardware (e.g., processor (s) 1602, audio subsystem 1606) for processing audio signals, including encoding and / or decoding of audio signals, as described herein.
ÐÑÐ¸Ð»Ð¾Ð¶ÐµÐ½Ð¸Ñ 1622 могÑÑ Ð²ÐºÐ»ÑÑаÑÑ Ð² ÑÐµÐ±Ñ Ð»Ñбое пÑогÑаммное пÑиложение, оÑноÑÑÑееÑÑ Ðº аÑдиоконÑенÑÑ, и/или к кодиÑованиÑ, и/или декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ Ð°ÑдиоконÑенÑа, в Ñом ÑиÑле, но не ÑолÑко: к медиаплееÑам, мÑзÑкалÑнÑм плееÑам (напÑимеÑ, MP3 плееÑам), пÑиложениÑм мобилÑнÑÑ ÑелеÑонов, ÑÑÑÑойÑÑвам PDA, ÑелевизионнÑм ÑиÑÑемам, ÑелевизионнÑм пÑиÑÑавкам. Родном ваÑианÑе аÑдиокодек Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð¸ÑполÑзован поÑÑавÑиком пÑикладнÑÑ ÑÑлÑг Ð´Ð»Ñ Ð¾Ð±ÐµÑпеÑÐµÐ½Ð¸Ñ ÑÑлÑг кодиÑованиÑ/декодиÑÐ¾Ð²Ð°Ð½Ð¸Ñ ÑеÑез ÑеÑÑ (напÑимеÑ, ÐнÑеÑнеÑ). Applications 1622 may include any software application related to audio content and / or to encoding and / or decoding audio content, including but not limited to: media players, music players (e.g., MP3 players), mobile phone applications, PDA devices, television systems, set-top boxes. In one embodiment, the audio codec may be used by an application service provider to provide encoding / decoding services over a network (e.g., the Internet).
РпÑиведенном вÑÑе опиÑании в ÑелÑÑ Ð¾Ð±ÑÑÑÐ½ÐµÐ½Ð¸Ñ Ð¸Ð·Ð»Ð¾Ð¶ÐµÐ½Ñ Ð¼Ð½Ð¾Ð³Ð¾ÑиÑленнÑе конкÑеÑнÑе деÑали, ÑÑÐ¾Ð±Ñ Ð¾Ð±ÐµÑпеÑиÑÑ Ð¿Ð¾Ð»Ð½Ð¾Ðµ понимание изобÑеÑениÑ. Ðднако ÑпеÑиалиÑÑам в данной облаÑÑи ÑÐµÑ Ð½Ð¸ÐºÐ¸ должно бÑÑÑ Ð¾Ñевидно, ÑÑо изобÑеÑение можно пÑакÑиÑеÑки ÑеализоваÑÑ Ð±ÐµÐ· ÑÑÐ¸Ñ ÐºÐ¾Ð½ÐºÑеÑнÑÑ Ð´ÐµÑалей. РдÑÑÐ³Ð¸Ñ Ð¿ÑимеÑÐ°Ñ ÑÑÑÑкÑÑÑÑ Ð¸ ÑÑÑÑойÑÑва Ð¿Ð¾ÐºÐ°Ð·Ð°Ð½Ñ Ð² виде блок-ÑÑ ÐµÐ¼ во избежание заÑÐµÐ¼Ð½ÐµÐ½Ð¸Ñ ÑÑÑи изобÑеÑениÑ.In the above description, for purposes of explanation, numerous specific details are set forth in order to provide a thorough understanding of the invention. However, it should be apparent to those skilled in the art that the invention can be practiced without these specific details. In other examples, structures and devices are shown in block diagrams in order to avoid obscuring the invention.
Ð ÑаÑÑноÑÑи, ÑпеÑиалиÑÑÑ Ð² данной облаÑÑи ÑÐµÑ Ð½Ð¸ÐºÐ¸ Ð´Ð¾Ð»Ð¶Ð½Ñ Ð¿Ð¾Ð½Ð¸Ð¼Ð°ÑÑ, ÑÑо могÑÑ Ð±ÑÑÑ Ð¸ÑполÑÐ·Ð¾Ð²Ð°Ð½Ñ Ð´ÑÑгие аÑÑ Ð¸ÑекÑÑÑÑ Ð¸ гÑаÑиÑеÑкие ÑÑÐµÐ´Ñ Ð¸ ÑÑо наÑÑоÑÑее изобÑеÑение можно ÑеализоваÑÑ Ñ Ð¸ÑполÑзованием гÑаÑиÑеÑÐºÐ¸Ñ Ð¸Ð½ÑÑÑÑменÑов и пÑодÑкÑов, оÑлиÑаÑÑÐ¸Ñ ÑÑ Ð¾Ñ Ð¾Ð¿Ð¸ÑаннÑÑ Ð²ÑÑе. Ð ÑаÑÑноÑÑи, Ð¿Ð¾Ð´Ñ Ð¾Ð´ по ÑÑ ÐµÐ¼Ðµ клиенÑ/ÑеÑÐ²ÐµÑ ÑвлÑеÑÑÑ Ð»Ð¸ÑÑ Ð¿ÑимеÑом аÑÑ Ð¸ÑекÑÑÑÑ, обеÑпеÑиваÑÑей инÑÑÑÑменÑалÑнÑе ÑÑнкÑионалÑнÑе возможноÑÑи наÑÑоÑÑего изобÑеÑениÑ; ÑпеÑиалиÑÑам в данной облаÑÑи ÑÐµÑ Ð½Ð¸ÐºÐ¸ оÑевидно, ÑÑо Ñакже могÑÑ Ð±ÑÑÑ Ð¸ÑполÑÐ·Ð¾Ð²Ð°Ð½Ñ Ð´ÑÑгие Ð¿Ð¾Ð´Ñ Ð¾Ð´Ñ, оÑлиÑаÑÑиеÑÑ Ð¾Ñ ÑÑ ÐµÐ¼Ñ ÐºÐ»Ð¸ÐµÐ½Ñ/ÑеÑвеÑ.In particular, those skilled in the art should understand that other architectures and graphical environments can be used and that the present invention can be implemented using graphical tools and products other than those described above. In particular, the client / server approach is just an example of an architecture providing instrumental functionality of the present invention; it will be apparent to those skilled in the art that other approaches other than a client / server scheme may also be used.
ÐекоÑоÑÑе ÑÐ°Ð·Ð´ÐµÐ»Ñ Ð¿Ð¾Ð´Ñобного опиÑÐ°Ð½Ð¸Ñ Ð¿ÑедÑÑÐ°Ð²Ð»ÐµÐ½Ñ Ð½Ð° ÑзÑке алгоÑиÑмов и ÑимволиÑеÑÐºÐ¸Ñ Ð¿ÑедÑÑавлений опеÑаÑий над биÑами даннÑÑ Ð² компÑÑÑеÑной памÑÑи. ÐÑи алгоÑиÑмиÑеÑкие опиÑÐ°Ð½Ð¸Ñ Ð¸ пÑедÑÑÐ°Ð²Ð»ÐµÐ½Ð¸Ñ ÑвлÑÑÑÑÑ ÑÑедÑÑвами, иÑполÑзÑемÑми ÑпеÑиалиÑÑами в облаÑÑи обÑабоÑки даннÑÑ Ð´Ð»Ñ Ð½Ð°Ð¸Ð±Ð¾Ð»ÐµÐµ ÑÑÑекÑивной пеÑедаÑи ÑÑÑеÑÑва Ñвоей ÑабоÑÑ Ð´ÑÑгим ÑпеÑиалиÑÑам в данной облаÑÑи ÑÐµÑ Ð½Ð¸ÐºÐ¸. Ðод алгоÑиÑмом здеÑÑ, как и в обÑем ÑлÑÑае, понимаеÑÑÑ ÑамоÑоглаÑÐ¾Ð²Ð°Ð½Ð½Ð°Ñ Ð¿Ð¾ÑледоваÑелÑноÑÑÑ Ñагов, пÑиводÑÑÐ°Ñ Ðº Ð¶ÐµÐ»Ð°ÐµÐ¼Ð¾Ð¼Ñ ÑезÑлÑÑаÑÑ. ÐÑи Ñаги ÑÑебÑÑÑ Ð²ÑÐ¿Ð¾Ð»Ð½ÐµÐ½Ð¸Ñ ÑизиÑеÑÐºÐ¸Ñ Ð¼Ð°Ð½Ð¸Ð¿ÑлÑÑий Ñ ÑизиÑеÑкими велиÑинами. ÐбÑÑно, Ñ Ð¾ÑÑ Ð½Ðµ обÑзаÑелÑно, ÑÑи велиÑÐ¸Ð½Ñ Ð¿ÑинимаÑÑ ÑоÑÐ¼Ñ ÑлекÑÑиÑеÑÐºÐ¸Ñ Ð¸Ð»Ð¸ магниÑнÑÑ Ñигналов, коÑоÑÑе можно запоминаÑÑ, пеÑедаваÑÑ, комбиниÑоваÑÑ Ð²Ð¼ÐµÑÑе, ÑÑавниваÑÑ Ð¸ вÑполнÑÑÑ Ñ Ð½Ð¸Ð¼Ð¸ инÑе манипÑлÑÑии. ÐÑи пÑакÑиÑеÑком иÑполÑзовании ÑÑи ÑÐ¸Ð³Ð½Ð°Ð»Ñ Ñдобно назÑваÑÑ Ð±Ð¸Ñами, знаÑениÑми, ÑлеменÑами, Ñимволами, знаками, Ñленами, ÑиÑлами или Ñ.п.Some sections of the detailed description are presented in the language of algorithms and symbolic representations of operations on data bits in computer memory. These algorithmic descriptions and representations are the means used by specialists in the field of data processing for the most efficient transfer of the essence of their work to other specialists in this field of technology. Here, as in the general case, an algorithm is understood as a self-consistent sequence of steps leading to the desired result. These steps require physical manipulations with physical quantities. Usually, although not necessarily, these quantities take the form of electrical or magnetic signals that can be stored, transmitted, combined together, compared and otherwise manipulated with them. In practical use, these signals are conveniently called bits, values, elements, symbols, signs, members, numbers, or the like.
ÐÑомÑÑÐ»ÐµÐ½Ð½Ð°Ñ Ð¿ÑименимоÑÑÑIndustrial applicability
Ðднако ÑледÑÐµÑ Ð¸Ð¼ÐµÑÑ Ð² видÑ, ÑÑо вÑе ÑказаннÑе и аналогиÑнÑе ÑеÑÐ¼Ð¸Ð½Ñ Ð´Ð¾Ð»Ð¶Ð½Ñ Ð±ÑÑÑ ÑвÑÐ·Ð°Ð½Ñ Ñ ÑооÑвеÑÑÑвÑÑÑими ÑизиÑеÑкими велиÑинами и ÑвлÑÑÑÑÑ Ð¿ÑоÑÑо ÑдобнÑми обознаÑениÑми, пÑименÑемÑми Ð´Ð»Ñ ÑÑÐ¸Ñ Ð²ÐµÐ»Ð¸Ñин. Ðак оÑевидно ÑледÑÐµÑ Ð¸Ð· данного обÑÑждениÑ, еÑли ÑпеÑиалÑно не оговоÑено иное, во вÑем опиÑании ÑаÑÑÑждениÑ, где иÑполÑзÑÑÑÑÑ Ñакие ÑеÑминÑ, как âобÑабоÑкаâ, âвÑÑиÑлениеâ, âÑаÑÑеÑÑâ, âопÑеделениеâ или âоÑобÑажениеâ и Ñ.п., оÑноÑÑÑÑÑ Ðº дейÑÑвиÑм и пÑоÑеÑÑам компÑÑÑеÑной ÑиÑÑÐµÐ¼Ñ Ð¸Ð»Ð¸ аналогиÑного ÑлекÑÑонного вÑÑиÑлиÑелÑного ÑÑÑÑойÑÑва, коÑоÑое манипÑлиÑÑÐµÑ Ð´Ð°Ð½Ð½Ñми и пÑеобÑазÑÐµÑ Ð´Ð°Ð½Ð½Ñе, пÑедÑÑавленнÑе в виде ÑизиÑеÑÐºÐ¸Ñ (ÑлекÑÑоннÑÑ ) велиÑин в ÑегиÑÑÑÐ°Ñ Ð¸ запоминаÑÑÐ¸Ñ ÑÑÑÑойÑÑÐ²Ð°Ñ ÐºÐ¾Ð¼Ð¿ÑÑÑеÑной ÑиÑÑемÑ, в дÑÑгие даннÑе, пÑедÑÑавлÑемÑе аналогиÑнÑм обÑазом как ÑизиÑеÑкие велиÑÐ¸Ð½Ñ Ð² запоминаÑÑÐ¸Ñ ÑÑÑÑойÑÑÐ²Ð°Ñ Ð¸ ÑегиÑÑÑÐ°Ñ ÐºÐ¾Ð¼Ð¿ÑÑÑеÑной ÑиÑÑÐµÐ¼Ñ Ð¸Ð»Ð¸ дÑÑÐ³Ð¸Ñ ÑÑÑÑойÑÑÐ²Ð°Ñ Ð´Ð»Ñ Ð·Ð°Ð¿Ð¾Ð¼Ð¸Ð½Ð°Ð½Ð¸Ñ, пеÑедаÑи или оÑобÑÐ°Ð¶ÐµÐ½Ð¸Ñ Ð¸Ð½ÑоÑмаÑии.However, it should be borne in mind that all these and similar terms should be associated with the corresponding physical quantities and are simply convenient notations used for these quantities. As obviously follows from this discussion, unless expressly agreed otherwise, in the entire description of reasoning, where terms such as âprocessingâ, âcalculationâ, âcalculationsâ, âdefinitionâ or âdisplayâ, etc. are used, refer to the actions and processes of a computer system or similar electronic computing device that manipulates data and converts data presented in the form of physical (electronic) quantities in registers and storage devices of a computer system into other data represented in the same way as physical quantities in memory devices and registers of a computer system or other devices for storing, transmitting or displaying information.
ÐаÑÑоÑÑее изобÑеÑение Ñакже оÑноÑиÑÑÑ Ðº ÑÑÑÑойÑÑÐ²Ñ Ð´Ð»Ñ Ð²ÑÐ¿Ð¾Ð»Ð½ÐµÐ½Ð¸Ñ Ð¾Ð¿ÐµÑаÑий. ÐÑо ÑÑÑÑойÑÑво Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ ÑпеÑиалÑно ÑконÑÑÑÑиÑовано Ð´Ð»Ñ ÑÑебÑемÑÑ Ñелей либо оно Ð¼Ð¾Ð¶ÐµÑ ÑодеÑжаÑÑ ÐºÐ¾Ð¼Ð¿ÑÑÑÐµÑ Ð¾Ð±Ñего назнаÑениÑ, избиÑаÑелÑно акÑивиÑÑемÑй или ÑеконÑигÑÑиÑÑемÑй компÑÑÑеÑной пÑогÑаммой, Ñ ÑанÑÑейÑÑ Ð² компÑÑÑеÑе. Ð£ÐºÐ°Ð·Ð°Ð½Ð½Ð°Ñ ÐºÐ¾Ð¼Ð¿ÑÑÑеÑÐ½Ð°Ñ Ð¿ÑогÑамма Ð¼Ð¾Ð¶ÐµÑ Ñ ÑаниÑÑÑÑ Ð½Ð° ÑÑиÑÑваемом компÑÑÑеÑом ноÑиÑеле, Ñаком как, но не ÑолÑко: диÑк лÑбого Ñипа, вклÑÑÐ°Ñ Ð³Ð¸Ð±ÐºÐ¸Ðµ диÑки, опÑиÑеÑкие диÑки, ÐºÐ¾Ð¼Ð¿Ð°ÐºÑ Ð´Ð¸Ñки (CD-ROM) и магниÑоопÑиÑеÑкие диÑки, памÑÑÑ ÑолÑко Ð´Ð»Ñ ÑÑиÑÑÐ²Ð°Ð½Ð¸Ñ (ROM), памÑÑÑ Ñ Ð¿ÑоизволÑнÑм доÑÑÑпом (RAM), ÑлекÑÑиÑеÑки ÑÑиÑаемÑе поÑÑоÑннÑе запоминаÑÑие ÑÑÑÑойÑÑва (EPROM), ÑлекÑÑиÑеÑки ÑÑиÑаемÑе пÑогÑаммиÑÑемÑе запоминаÑÑие ÑÑÑÑойÑÑва (EEPROM), магниÑнÑе или опÑиÑеÑкие каÑÑÑ Ð¸Ð»Ð¸ ноÑиÑели лÑбого Ñипа, Ð¿Ð¾Ð´Ñ Ð¾Ð´ÑÑие Ð´Ð»Ñ Ð·Ð°Ð¿Ð¾Ð¼Ð¸Ð½Ð°Ð½Ð¸Ñ ÑлекÑÑоннÑÑ ÐºÐ¾Ð¼Ð°Ð½Ð´ и ÑвÑзаннÑе Ñ Ñиной компÑÑÑеÑной ÑиÑÑемÑ.The present invention also relates to a device for performing operations. This device can be specially designed for the required purposes or it can contain a general-purpose computer selectively activated or reconfigurable by a computer program stored in a computer. The specified computer program may be stored on a computer-readable medium, such as, but not limited to: any type of disk, including floppy disks, optical disks, compact discs (CD-ROM) and magneto-optical disks, read-only memory (ROM), random-access memory access (RAM), electrically erasable read-only memory devices (EPROM), electrically erasable programmable memory devices (EEPROM), magnetic or optical cards or any type of media suitable for storing electronic commands and connected to the bus computer system.
ÐÑедÑÑавленнÑе здеÑÑ Ð°Ð»Ð³Ð¾ÑиÑÐ¼Ñ Ð¸ модÑли по ÑÑÑеÑÑÐ²Ñ Ð½Ðµ оÑноÑÑÑÑÑ Ðº какомÑ-либо конкÑеÑÐ½Ð¾Ð¼Ñ ÐºÐ¾Ð¼Ð¿ÑÑÑеÑÑ Ð¸Ð»Ð¸ Ð¸Ð½Ð¾Ð¼Ñ ÑÑÑÑойÑÑвÑ. ÐогÑÑ Ð±ÑÑÑ Ð¸ÑполÑÐ·Ð¾Ð²Ð°Ð½Ñ ÑиÑÑÐµÐ¼Ñ Ð¾Ð±Ñего назнаÑÐµÐ½Ð¸Ñ Ñ Ð¿ÑогÑаммами в ÑооÑвеÑÑÑвии Ñ Ð¸Ð·Ð»Ð¾Ð¶ÐµÐ½Ð½Ñми здеÑÑ Ð¾ÑновнÑми пÑинÑипами, или бÑваеÑ, ÑÑо Ñдобнее ÑконÑÑÑÑиÑоваÑÑ Ð±Ð¾Ð»ÐµÐµ ÑпеÑиализиÑованнÑе ÑÑÑÑойÑÑва Ð´Ð»Ñ Ð²ÑÐ¿Ð¾Ð»Ð½ÐµÐ½Ð¸Ñ Ñагов ÑаÑкÑÑÑÑÑ Ð·Ð´ÐµÑÑ ÑпоÑобов. ÐÐµÐ¾Ð±Ñ Ð¾Ð´Ð¸Ð¼Ð°Ñ ÑÑÑÑкÑÑÑа Ð´Ð»Ñ ÑÑÐ¸Ñ ÑазнообÑазнÑÑ ÑиÑÑем вÑÑÐµÐºÐ°ÐµÑ Ð¸Ð· пÑиведенного ниже опиÑаниÑ. Ðдобавок наÑÑоÑÑее изобÑеÑение не опиÑано Ñо ÑÑÑлками на какой-либо конкÑеÑнÑй пÑогÑаммнÑй ÑзÑк. Ценно Ñо, ÑÑо Ð´Ð»Ñ ÑеализаÑии опиÑаннÑÑ Ð·Ð´ÐµÑÑ Ð¾ÑновнÑÑ Ð¿ÑинÑипов изобÑеÑÐµÐ½Ð¸Ñ Ð¼Ð¾Ð¶Ð½Ð¾ иÑполÑзоваÑÑ Ð¼Ð½Ð¾Ð¶ÐµÑÑво ÑазлиÑнÑÑ ÑзÑков пÑогÑаммиÑованиÑ. ÐÑоме Ñого, ÑпеÑиалиÑÑам в данной облаÑÑи ÑÐµÑ Ð½Ð¸ÐºÐ¸ должно бÑÑÑ ÑÑно, ÑÑо ÑказаннÑе модÑли, пÑизнаки, аÑÑибÑÑÑ, меÑодики и дÑÑгие аÑпекÑÑ Ð¸Ð·Ð¾Ð±ÑеÑÐµÐ½Ð¸Ñ Ð¼Ð¾Ð³ÑÑ Ð±ÑÑÑ ÑÐµÐ°Ð»Ð¸Ð·Ð¾Ð²Ð°Ð½Ñ Ð² виде пÑогÑаммнÑÑ ÑÑедÑÑв, аппаÑаÑнÑÑ ÑÑедÑÑв, пÑогÑаммно-аппаÑаÑнÑÑ ÑÑедÑÑв или лÑбой Ð¸Ñ ÐºÐ¾Ð¼Ð±Ð¸Ð½Ð°Ñии. ÐонеÑно, когда компоненÑа наÑÑоÑÑего изобÑеÑÐµÐ½Ð¸Ñ Ñеализована в виде пÑогÑаммного ÑÑедÑÑва, она Ð¼Ð¾Ð¶ÐµÑ Ð±ÑÑÑ Ð²Ñполнена в виде авÑономной пÑогÑаммÑ, в виде ÑаÑÑи более кÑÑпной пÑогÑаммÑ, множеÑÑва оÑделÑнÑÑ Ð¿ÑогÑамм, ÑÑаÑиÑеÑки или динамиÑеÑки ÑвÑзанной библиоÑеки, загÑÑжаемого в ÑдÑо модÑÐ»Ñ Ð¸/или лÑбÑм дÑÑгим пÑÑем, извеÑÑнÑм в наÑÑоÑÑее вÑÐµÐ¼Ñ Ð¸Ð»Ð¸ коÑоÑÑй Ð¼Ð¾Ð¶ÐµÑ Ð¿Ð¾ÑвиÑÑÑÑ Ð² бÑдÑÑем в ÑаÑпоÑÑжении ÑпеÑиалиÑÑов в облаÑÑи компÑÑÑеÑного пÑогÑаммиÑованиÑ. Ðдобавок наÑÑоÑÑее изобÑеÑение не огÑаниÑиваеÑÑÑ ÑеализаÑией в ÑÐ°Ð¼ÐºÐ°Ñ ÐºÐ°ÐºÐ¾Ð¹-либо конкÑеÑной опеÑаÑионной ÑиÑÑÐµÐ¼Ñ Ð¸Ð»Ð¸ ÑÑедÑ.The algorithms and modules presented here are essentially not related to any particular computer or other device. General-purpose systems with programs may be used in accordance with the basic principles set forth herein, or it may be more convenient to design more specialized devices to perform the steps of the methods disclosed herein. The necessary structure for these various systems follows from the description below. In addition, the present invention is not described with reference to any particular programming language. It is valuable that for the implementation of the basic principles of the invention described here, you can use many different programming languages. In addition, it should be apparent to those skilled in the art that these modules, features, attributes, techniques, and other aspects of the invention may be implemented as software, hardware, firmware, or any combination thereof. Of course, when a component of the present invention is implemented as a software tool, it can be implemented as a stand-alone program, as part of a larger program, many separate programs, a statically or dynamically linked library, loaded into the kernel of the module and / or in any other way known at present or which may appear in the future at the disposal of specialists in the field of computer programming. In addition, the present invention is not limited to implementation within any particular operating system or environment.
СпеÑиалиÑÑам в данной облаÑÑи ÑÐµÑ Ð½Ð¸ÐºÐ¸ должно бÑÑÑ ÑÑно, ÑÑо в обÑÑжденнÑй здеÑÑ Ð²Ð°ÑÐ¸Ð°Ð½Ñ Ð¸Ð·Ð¾Ð±ÑеÑÐµÐ½Ð¸Ñ Ð¼Ð¾Ð³ÑÑ Ð±ÑÑÑ Ð²Ð½ÐµÑÐµÐ½Ñ ÑазлиÑнÑе Ð¸Ð·Ð¼ÐµÐ½ÐµÐ½Ð¸Ñ Ð¸ модиÑикаÑии, не вÑÑ Ð¾Ð´ÑÑие за Ñамки ÑÑÑеÑÑва или обÑема изобÑеÑениÑ. Таким обÑазом, здеÑÑ Ð¿ÑедполагаеÑÑÑ, ÑÑо наÑÑоÑÑее изобÑеÑение покÑÑÐ²Ð°ÐµÑ Ð²Ñе ÑказаннÑе модиÑикаÑии и Ð²Ð¸Ð´Ð¾Ð¸Ð·Ð¼ÐµÐ½ÐµÐ½Ð¸Ñ ÑаÑкÑÑÑÑÑ Ð·Ð´ÐµÑÑ Ð²Ð°ÑианÑов, пÑи ÑÑловии, еÑли ÑказаннÑе модиÑикаÑии и Ð²Ð¸Ð´Ð¾Ð¸Ð·Ð¼ÐµÐ½ÐµÐ½Ð¸Ñ Ð½Ðµ вÑÑ Ð¾Ð´ÑÑ Ð·Ð° Ñамки обÑема пÑилагаемой ÑоÑмÑÐ»Ñ Ð¸Ð·Ð¾Ð±ÑеÑÐµÐ½Ð¸Ñ Ð¸ ее ÑквиваленÑов.Those skilled in the art will appreciate that various changes and modifications may be made to the embodiment of the invention discussed herein without departing from the spirit or scope of the invention. Thus, it is intended here that the present invention covers all of these modifications and variations of the embodiments disclosed herein, provided that these modifications and modifications are not beyond the scope of the appended claims and their equivalents.
RetroSearch is an open source project built by @garambo | Open a GitHub Issue
Search and Browse the WWW like it's 1997 | Search results from DuckDuckGo
HTML:
3.2
| Encoding:
UTF-8
| Version:
0.7.4