Information

GSM Audio Codec / Vocoder

GSM Audio Codec / Vocoder


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Für den allgemeinen Gebrauch stehen verschiedene Formen von Audio-Codecs oder Vocodern zur Verfügung, und das GSM-System unterstützt eine Reihe spezifischer Audio-Codecs. Dazu gehören die Codecs RPE-LPC, Half Rate und AMR. Die Leistung jedes Sprachcodecs ist unterschiedlich und sie können unter verschiedenen Bedingungen verwendet werden, obwohl der AMR-Codec heute am weitesten verbreitet ist. Auch der neuere AMR-Breitband-Codec (AMR-WB) wird in vielen Bereichen eingeführt, einschließlich GSM

Die Sprachcodec-Technologie hat in den letzten Jahren aufgrund der zunehmenden verfügbaren Rechenleistung erhebliche Fortschritte gemacht. Dies hat dazu geführt, dass die im GSM-System verwendeten Sprachcodecs seit Einführung der ersten GSM-Telefone große Verbesserungen aufweisen.

Vocoder / Codec Grundlagen

Vocoder oder Sprachcodecs werden in vielen Bereichen der Sprachkommunikation verwendet. Natürlich liegt der Fokus hier auf GSM-Audio-Codecs oder Vocodern, aber die gleichen Prinzipien gelten für jede Form von Codec.

Wenn Sprache linear digitalisiert würde, würde dies eine hohe Datenrate erfordern, die eine sehr große Bandbreite einnehmen würde. Da die Bandbreite in jedem Kommunikationssystem normalerweise begrenzt ist, müssen die Daten komprimiert werden, um sie über den verfügbaren Kanal zu senden. Sobald der Kanal durchlaufen ist, kann er erweitert werden, um das Audio so zu regenerieren, dass es dem Original so nahe wie möglich kommt.

Um die Anforderungen des Codec-Systems zu erfüllen, muss die Sprache mit einer ausreichend hohen Abtastrate und Auflösung aufgenommen werden, um eine klare Wiedergabe des Originaltons zu ermöglichen. Es muss dann so komprimiert werden, dass die Wiedergabetreue über einen fehleranfälligen drahtlosen Übertragungskanal mit begrenzter Bitrate erhalten bleibt.

Audio-Codecs oder Vocoder können eine Vielzahl von Techniken verwenden, aber viele moderne Audio-Codecs verwenden eine Technik, die als lineare Vorhersage bekannt ist. In vielerlei Hinsicht kann dies mit einer mathematischen Modellierung des menschlichen Stimmapparates verglichen werden. Um dies zu erreichen, wird die spektrale Hüllkurve des Signals unter Verwendung einer Filtertechnik geschätzt. Selbst wenn Signale mit vielen nicht harmonisch verwandten Signalen verwendet werden, können Sprachcodecs sehr hohe Komprimierungsgrade erzielen.

Für GSM-Codecs werden verschiedene Codec-Methoden verwendet:

  • CELP: Der CELP- oder Code Excited Linear Prediction-Codec ist ein Vocoder-Algorithmus, der ursprünglich 1985 vorgeschlagen wurde und eine signifikante Verbesserung gegenüber anderen Sprachcodecs des Tages darstellt. Das Grundprinzip des CELP-Codecs wurde entwickelt und als Grundlage für andere Sprachcodecs wie ACELP, RCELP, VSELP usw. verwendet. Daher ist die CELP-Codec-Methodik heute der am weitesten verbreitete Sprachcodierungsalgorithmus. Dementsprechend wird CELP jetzt als Oberbegriff für eine bestimmte Klasse von Vocodern oder Sprachcodecs und nicht für einen bestimmten Codec verwendet.

    Das Hauptprinzip des CELP-Codecs besteht darin, dass ein Prinzip verwendet wird, das als "Analyse durch Synthese" bekannt ist. In diesem Prozess wird die Codierung durchgeführt, indem das decodierte Signal in einem System mit geschlossener Schleife wahrnehmungsmäßig optimiert wird. Eine Möglichkeit, dies zu erreichen, besteht darin, eine Vielzahl von erzeugten Bitströmen zu vergleichen und diejenige auszuwählen, die das am besten klingende Signal erzeugt.

  • ACELP-Codec: Der Codec ACELP oder Algebraic Code Excited Linear Prediction. Der ACELP-Codec- oder Vocoder-Algorithmus ist eine Weiterentwicklung des CELP-Modells. Die ACELP-Codec-Codebücher haben jedoch eine spezifische algebraische Struktur, wie durch den Namen angegeben.
  • VSELP-Codec: Der Codec VSELP oder Vector Sum Excitation Linear Prediction. Einer der Hauptnachteile des VSELP-Codecs ist seine eingeschränkte Fähigkeit, Nicht-Sprachlaute zu codieren. Dies bedeutet, dass es bei Vorhandensein von Rauschen schlecht funktioniert. Infolgedessen wird dieser Sprachcodec nicht mehr so ​​häufig verwendet, da andere neuere Sprachcodecs bevorzugt werden und eine weitaus überlegene Leistung bieten.

GSM-Audio-Codecs / Vocoder

Eine Vielzahl von GSM-Audio-Codecs / Vocodern wird unterstützt. Diese wurden zu unterschiedlichen Zeiten eingeführt und weisen unterschiedliche Leistungsniveaus auf. Obwohl einige der frühen Audio-Codecs heutzutage nicht mehr so ​​häufig verwendet werden, werden sie hier immer noch beschrieben, da sie Teil des GSM-Systems sind.


GSM-Audio-Codecs
Codec-NameBitrate
(kbps)
Kompressionstechnik
Volltarif13RTE-LPC
EFR12.2ACELP
Halber Preis5.6VSELP
AMR12.2 - 4.75ACELP
AMR-WB23.85 - 6.60ACELP

GSM Full Rate / RPE-LPC-Codec

Der RPE-LPC oder Regular Pulse Excited - Linear Predictive Coder. Diese Form des Sprachcodecs war der erste mit GSM verwendete Sprachcodec und wurde ausgewählt, nachdem Tests durchgeführt wurden, um ihn mit anderen Codec-Schemata des Tages zu vergleichen. Der Sprachcodec basiert auf der regulären Impulsanregungs-LPC mit Langzeitvorhersage. Das Grundschema bezieht sich auf zwei frühere Sprachcodecs, nämlich: RELP, Residual Excited Linear Prediction und auf den MPE-LPC, Multi Pulse Excited LPC. Die Vorteile von RELP sind die relativ geringe Komplexität, die sich aus der Verwendung der Basisbandcodierung ergibt, deren Leistung jedoch durch das vom System erzeugte Tonrauschen begrenzt ist. Der MPE-LPC ist komplexer, bietet jedoch ein besseres Leistungsniveau. Der RPE-LPC-Codec bot einen Kompromiss zwischen beiden und brachte Leistung und Komplexität für die damalige Technologie in Einklang.

Trotz der Arbeit, die unternommen wurde, um die optimale Leistung zu erzielen, wurde der RPE-LPC-Codec im Zuge der Weiterentwicklung der Technologie als mit einer schlechten Sprachqualität angesehen. Als andere Audio-Codecs mit voller Rate verfügbar wurden, wurden diese in das System integriert.

GSM EFR - Verbesserter Full Rate Codec

Später wurde ein weiterer Vocoder namens Enhanced Full Rate (EFR) -Vocoder hinzugefügt, um auf die schlechte Qualität zu reagieren, die von den Benutzern des ursprünglichen RPE-LPC-Codecs wahrgenommen wurde. Dieser neue Codec lieferte eine viel bessere Klangqualität und wurde von GSM übernommen. Mit der ACELP-Komprimierungstechnologie konnte die Qualität gegenüber dem ursprünglichen LPC-RPE-Encoder erheblich verbessert werden. Es wurde möglich, dass die verfügbare Verarbeitungsleistung in Mobiltelefonen aufgrund höherer Verarbeitungsleistung in Kombination mit ihrem geringeren Stromverbrauch zunahm.

GSM Half Rate Codec

Der GSM-Standard ermöglicht die Aufteilung eines einzelnen Sprachkanals mit voller Rate in zwei Unterkanäle, die separate Anrufe aufrechterhalten können. Auf diese Weise können Netzbetreiber die Anzahl der Sprachanrufe, die vom Netz verarbeitet werden können, mit sehr geringen zusätzlichen Investitionen verdoppeln.

Damit diese Funktion verwendet werden kann, muss ein Codec mit halber Rate verwendet werden. Der Codec mit halber Rate wurde in den Anfangsjahren von GSM eingeführt, ergab jedoch im Vergleich zu anderen Sprachcodecs eine viel schlechtere Sprachqualität. Es bot jedoch Vorteile, wenn die Nachfrage hoch und die Netzwerkkapazität hoch war.

Der GSM-Codec mit halber Rate verwendet einen VSELP-Codec-Algorithmus. Es codiert die Daten um 20-ms-Rahmen, die jeweils 112 Bit tragen, um eine Datenrate von 5,6 kbps zu ergeben. Dies beinhaltet eine Datenrate von 100 Bit / s für eine Modusanzeige, die angibt, ob das System glaubt, dass die Frames Sprachdaten enthalten oder nicht. Dadurch kann der Sprachcodec auf eine Weise arbeiten, die die optimale Qualität bietet.

Das Half Rate Codec-System wurde in den 1990er Jahren eingeführt, aber angesichts der als schlecht empfundenen Qualität nicht weit verbreitet.

GSM AMR Codec

Der AMR Adaptive Multi-Rate-Codec ist heute der am weitesten verbreitete GSM-Codec. Der AMR-Codec wurde im Oktober 1988 von 3GPP übernommen und wird sowohl für GSM- als auch für leitungsvermittelte UMTS / WCDMA-Sprachanrufe verwendet.

Der AMR-Codec bietet eine Vielzahl von Optionen für eine von acht verschiedenen Bitraten, wie in der folgenden Tabelle beschrieben. Die Bitraten basieren auf Frames, die 20 Milliskunden lang sind und 160 Samples enthalten. Der AMR-Codec verwendet eine Vielzahl verschiedener Techniken, um die Datenkomprimierung bereitzustellen. Der ACELP-Codec wird als Grundlage für den gesamten Sprachcodec verwendet, aber zusätzlich werden andere Techniken verwendet. Eine diskontinuierliche Übertragung wird verwendet, so dass die Übertragung unterbrochen wird, wenn keine Sprachaktivität vorliegt. Zusätzlich wird die Sprachaktivitätserkennung (VAD) verwendet, um anzuzeigen, wenn nur Hintergrundgeräusche und keine Sprache vorhanden sind. Zusätzlich wird ein Comfort Noise Generator (CNG) verwendet, um dem Benutzer das Feedback zu geben, dass die Verbindung noch vorhanden ist, um Hintergrundgeräusche zu erzeugen, selbst wenn keine Sprachdaten übertragen werden. Dies wird lokal am Empfänger hinzugefügt.

Die Verwendung des AMR-Codecs erfordert auch die Verwendung einer optimierten Verbindungsanpassung, so dass die optimale Datenrate ausgewählt wird, um die Anforderungen der aktuellen Funkkanalbedingungen einschließlich des Signal-Rausch-Verhältnisses und der Kapazität zu erfüllen. Dies wird erreicht, indem die Quellcodierung reduziert und die Kanalcodierung erhöht wird. Obwohl die Sprachverständlichkeit verringert ist, ist die Netzwerkverbindung robuster und die Verbindung wird ohne Ausfall aufrechterhalten. Es können Verbesserungspegel zwischen 4 und 6 dB auftreten. Netzbetreiber können jedoch jede Station nach Qualität oder Kapazität priorisieren.

Der AMR-Codec verfügt über insgesamt acht Tarife: Acht sind zum vollen Tarif (FR) verfügbar, während sechs zum halben Tarif (HR) verfügbar sind. Dies ergibt insgesamt vierzehn verschiedene Modi.


AMR-Codec-Datenraten
ModusBitrate
(kbps)
Volle Rate (FR) /
Halbe Rate (HR)
AMR 12.212.2FR
AMR 10.210.2FR
AMR 7,957.95FR / HR
AMR 7.407.40FR / HR
AMR 6,706.70FR / HR
AMR 5,905.90FR / HR
AMR 5.155.15FR / HR
AMR 4,754.75FR / HR

AMR-WB-Codec

Der adaptive Multi-Rate-Breitband-AMR-WB-Codec, der auch unter der ITU-Bezeichnung G.722.2 bekannt ist, basiert auf dem früheren beliebten AMR-Codec Adaptive Multi-Rate. AMR-WB verwendet für seinen Betrieb ebenfalls eine ACELP-Basis, wurde jedoch weiterentwickelt und AMR-WB bietet aufgrund der größeren Sprachbandbreite, die es codiert, eine verbesserte Sprachqualität. AMR-WB hat eine Bandbreite von 50 bis 7000 Hz, die erheblich breiter ist als die von Standardtelefonen verwendeten Bandbreiten von 300 bis 3400 Hz. Dies geht jedoch zu Lasten einer zusätzlichen Verarbeitung. Mit den Fortschritten in der IC-Technologie in den letzten Jahren ist dies jedoch durchaus akzeptabel.

Der AMR-WB-Codec enthält eine Reihe von Funktionsbereichen: Er enthält hauptsächlich eine Reihe von Sprach- und Kanalcodec-Modi mit fester Rate. Es enthält auch andere Codec-Funktionen, darunter: einen Voice Activity Detector (VAD); DTX-Funktionalität (Discontinuous Transmission) für GSM; und SCR-Funktionalität (Source Controlled Rate) für UMTS-Anwendungen. Weitere Funktionen umfassen In-Band-Signalisierung für die Übertragung im Codec-Modus und Verbindungsanpassung zur Steuerung der Modusauswahl.

Der AMR-WB-Codec hat eine Abtastrate von 16 kHz und die Codierung erfolgt in Blöcken von 20 ms. Es werden zwei Frequenzbänder verwendet: 50-6400 Hz und 6400-7000 Hz. Diese werden separat codiert, um die Komplexität des Codecs zu verringern. Diese Aufteilung dient auch dazu, die Bitzuordnung auf den subjektiv wichtigsten Frequenzbereich zu fokussieren.

Das untere Frequenzband verwendet einen ACELP-Codec-Algorithmus, obwohl eine Reihe zusätzlicher Funktionen enthalten sind, um die subjektive Qualität des Audios zu verbessern. Die lineare Vorhersageanalyse wird einmal pro 20-ms-Rahmen durchgeführt. Außerdem werden alle 5 ms feste und adaptive Anregungscodebücher nach optimalen Codec-Parameterwerten durchsucht.

Das höhere Frequenzband verleiht der Stimme einige der Natürlichkeits- und Persönlichkeitsmerkmale. Das Audio wird unter Verwendung der Parameter aus dem unteren Band sowie unter Verwendung einer zufälligen Anregung rekonstruiert. Da der Leistungspegel in diesem Band geringer ist als der des unteren Bandes, wird die Verstärkung relativ zum unteren Band eingestellt, jedoch basierend auf Sprachinformationen. Der Signalgehalt des höheren Bandes wird unter Verwendung eines linearen Vorhersagefilters rekonstruiert, das Informationen aus dem unteren Bandfilter erzeugt.


AMR-WB Codec
Bitrate
(kbps)
Anmerkungen
6.60Dies ist die niedrigste Rate für AMR-WB. Es wird für leitungsvermittelte Verbindungen für GSM und UMTS verwendet und ist nur zur vorübergehenden Verwendung unter schwierigen Funkkanalbedingungen oder während einer Überlastung des Netzwerks vorgesehen.
8.85Dies führt zu einer verbesserten Qualität gegenüber der 6,6-kbit / s-Rate. Auch hier wird die Verwendung nur für Überlastungsperioden oder unter schwierigen Funkkanalbedingungen empfohlen.
12.65Dies ist die Hauptbitrate, die für leitungsvermitteltes GSM und UMTS verwendet wird und dem ursprünglichen AMR-Codec eine überlegene Leistung bietet.
14.25Eine höhere Bitrate sorgt für sauberere Sprache und ist besonders nützlich, wenn die Umgebungsgeräusche hoch sind.
15.85Eine höhere Bitrate sorgt für sauberere Sprache und ist besonders nützlich, wenn die Umgebungsgeräusche hoch sind.
18.25Eine höhere Bitrate sorgt für sauberere Sprache und ist besonders nützlich, wenn die Umgebungsgeräusche hoch sind.
19.85Eine höhere Bitrate sorgt für sauberere Sprache und ist besonders nützlich, wenn die Umgebungsgeräusche hoch sind.
23.05Nicht empfohlen für GSM-Kanäle mit voller Rate.
23.85Nicht empfohlen für GSM-Kanäle mit voller Rate und bietet eine Sprachqualität ähnlich der von G.722 bei 64 kbps.

Nicht alle mit AMR-WB ausgestatteten Telefone können auf alle Datenraten zugreifen. Für die verschiedenen Funktionen des Telefons müssen beispielsweise möglicherweise nicht alle aktiv sein. Infolgedessen ist es notwendig, das Netzwerk darüber zu informieren, welche Tarife verfügbar sind, und dadurch die Aushandlung zwischen dem Mobilteil und dem Netzwerk zu vereinfachen. Um dies zu erreichen, stehen drei verschiedene AMR-WB-Konfigurationen zur Verfügung:

  • Konfiguration A: 6,6, 8,85 und 12,65 kbit / s
  • Konfiguration B: 6,6, 8,85, 12,65 und 15,85 kbit / s
  • Konfiguration C: 6,6, 8,85, 12,65 und 23,85 kbit / s

Es ist ersichtlich, dass nur die Modi 23,85, 15,85, 12,65, 8,85 und 6,60 kbit / s verwendet werden. Basierend auf Hörtests wurde angenommen, dass diese fünf Modi für einen qualitativ hochwertigen Sprachtelefondienst ausreichen. Die anderen Datenraten wurden beibehalten und können für andere Zwecke verwendet werden, einschließlich Multimedia-Nachrichten, Audio-Streaming usw.

Obwohl diese als GSM-Codecs beschrieben wurden, werden sie auch in einer Reihe anderer Bereiche verwendet - einige werden mit der in UMTS verwendeten leitungsvermittelten Sprache verwendet. Die Codec-Leistung hat sich seit Einführung der ersten GSM-Codecs verbessert: Die Sprachqualität sowie die erforderliche Bandbreite wurden verbessert.

Themen zu drahtloser und drahtgebundener Konnektivität:
Grundlagen der Mobilkommunikation2G GSM3G UMTS4G LTE5GWiFiIEEE 802.15.4DECT SchnurlostelefoneNFC- NahfeldkommunikationNetzwerkgrundlagenWas sind die CloudEthernetSerial-DatenUSBSigFoxLoRaVoIPSDNNFVSD-WAN
Kehren Sie zu Wireless & Wired Connectivity zurück


Schau das Video: W GSM AND CDMA codecs RELP and CELP (Juli 2022).


Bemerkungen:

  1. Tulio

    Überflüssige Worte nicht verschwenden.

  2. Mezik

    Betrachten Sie, welchen Charakter des Jobs

  3. Farnell

    Ich entschuldige mich für die Einmischung, aber ich schlage vor, in die andere Richtung zu gehen.

  4. Moogugore

    Und wie in diesem Fall handeln?

  5. Agramant

    Es ist sicherlich richtig



Eine Nachricht schreiben