Jitter og hakkende/forvrænget tale

Videnskaben bag Jitter

Jitter er en slags tidsvariation i ankomsten af datapakker i et netværk. Det opstår, når datapakker, der sendes med jævne mellemrum, ankommer med forskelligt-artede forsinkelser. Dette kan skyldes fysiske og tekniske faktorer i netværket, såsom køer i routere, varierende trafikbelastning, begrænsninger i netværksinfrastrukturen, trådløs signal tab og mange flere.


Netværkskommunikation

Når data overføres via et digitalt netværk (f.eks. VoIP-opkald eller videostreaming), bliver lyden opdelt i små datapakker, som sendes sekventielt gennem netværket.

I en ideel situation ville alle pakker ankomme med en ensartet tidsforskel (f.eks. hver 5. millisekund). Men i virkeligheden påvirkes pakkerne af:

  • Netværksforsinkelse (latency): Tid det tager for en pakke at rejse fra afsender til modtager.
  • Pakketab: Nogle pakker går tabt undervejs og bliver enten genskabt eller ignoreret.
  • Køer i routere og switches: Hvis netværket er belastet, kan pakker blive midlertidigt opbevaret i buffere, hvilket skaber forsinkelser.

Jitter måles som variationen i forsinkelsen mellem ankomne pakker. Hvis variationen er for høj, vil modtageren opleve hakkende eller forvrænget lyd.


Matematiske modeller for jitter

Jitter kan modelleres med stokastiske processer, som beskriver tilfældige variationer over tid. Nogle af de mest anvendte modeller er:

a) Normalfordeling (Gaussian jitter)

  • Hvis jitter skyldes tilfældige små variationer i netværkstrafikken, kan forsinkelserne følge en normalfordeling (gaussisk fordeling), hvor de fleste pakker ankommer med en gennemsnitlig forsinkelse, men nogle få er forsinkede eller ankommer hurtigere end normalt.

b) Poissonfordeling (Burst jitter)

  • Hvis jitteren skyldes periodiske overbelastninger i netværket, kan den følge en Poisson-proces, hvor forsinkelser sker i “burst” – pludselige, korte udbrud eller perioder med høj jitter, efterfulgt af stabile perioder.

Matematisk kan jitter ofte beregnes som standardafvigelsen af forsinkelserne mellem datapakker:

hvor:

  • di er forsinkelsen for pakke i
  • d er den gennemsnitlige forsinkelse
  • N er antallet af målte pakker

Netværksprotokoller og Jitter-buffer

For at kompensere for jitter har mange systemer en jitter-buffer, som opbevarer pakker i kort tid, før de afspilles. Dette giver mulighed for at omorganisere pakker og sikre en mere stabil lydstrøm.

  • Dynamiske jitter-buffere: Justerer buffertiden baseret på målinger af jitter i realtid. Jo større jitter, jo større buffer opbygger systemet.
  • Statisk jitter-buffer: Har en fast forsinkelse, men kan være ineffektiv, hvis netværksforholdene ændrer sig.

Nogle netværksprotokoller, som RTP (Real-time Transport Protocol), anvender tidsstempler og sekvensnumre for at korrigere Jitter.


Andre konsekvenser af Jitter

  • I digitale lydsystemer kan Jitter føre til forvrængning af lydsignaler.
  • I videooverførsel kan Jitter føre til hakkende billeder eller synkroniseringsproblemer mellem lyd og video.

Opsummering af Jitter

Jitter er en kompleks effekt forårsaget af variation i datapakkernes forsinkelser under transmission. Den påvirker alt fra VoIP-opkald til finansielle systemer og elektroniske kredsløb. Ved at bruge jitter-buffere og QoS (Quality of Service) kan netværket minimere Jitter og sikre mere stabile forbindelser.

Forvrænget lyd

Den tekniske betegnelse for den robotagtige lyd i digitale telefonsamtaler og lydtransmission er ofte relateret til følgende begreber:

1. Vocoder-artifakter

  • En vocoder (Voice Coder) er en teknologi, der analyserer og syntetiserer tale. Hvis codec’et bruger stærk komprimering eller genskaber manglende datapakker, kan stemmen lyde kunstig og mekanisk/ metallisk.
  • Denne effekt kaldes ofte for vocoder-artifakter, fordi lyden minder om den kunstige tale, som f.eks. robotstemmer eller tidlige digitale stemmegeneratorer brugte.

2. Quantization noise (kvantiseringstøj)

  • Når lyddata konverteres fra analog til digital, afrundes værdierne til nærmeste digitale trin.
  • Hvis bitraten er lav, altså indeholder få data om lyden, kan afrundingsfejl føre til en trappetrins-effekt i lyden, som kan give en hakkende eller metallisk klang.Trappetrins-effekten (quantization error) opstår, når et analogt signal konverteres til digital form med en lav opløsning (lav bitrate eller lav bitdybde). Når en kontinuerlig lyd (analog bølge) skal repræsenteres digitalt, sker det ved, at lyden samles op (samplingsfrekvens) og afrundes til nærmeste mulige værdi (kvantisering). Hvis der ikke er nok bit til at repræsentere små ændringer i lyden, vil signalet fremstå som hakvist i stedet for glat – ligesom en trappe i stedet for en skråning.

3. Pakketabsskjul – Packet loss concealment (PLC-artifakter)

  • Når datapakker går tabt under transmission, forsøger systemet at udfylde hullerne ved at gætte, hvad den manglende lyd var.
  • Dette kan give en robotagtig eller hakkende lyd, fordi systemet ikke kan genskabe den originale lyd præcist.

4. Tidsforvrængning (Temporal warping)

  • Opstår, når jitter (varierende forsinkelse) får systemet til at strække eller komprimere lyd for at synkronisere talen.
  • Hvis stemmen afspilles hurtigere eller langsommere, kan den lyde unaturligt og mekanisk.

5. Spektral forvrængning (Spectral distortion)

  • Visse kodeker (f.eks. G.729) fjerner høje frekvenser og detaljer i stemmen for at spare båndbredde.
  • Dette kan resultere i en metallisk, nasal eller hul lyd, som kan minde om en robotstemmes begrænsede tonalitet.

6. Auto-tune-effekt

  • Selvom auto-tune normalt bruges til musik, kan en lignende effekt opstå, når et Codec forsøger at rekonstruere tale baseret på forudsigelser.
  • Hvis netværket er ustabilt, kan stemmens tonehøjde variere unaturligt, hvilket får den til at lyde kunstig.

Opsummering på forvrængning

Forvrængning opstår, når et lydsignal ændres uønsket under transmission, optagelse eller behandling. Det kan skyldes både digitale faktorer (komprimering, jitter, pakketab, kvantisering) og analoge faktorer (forstærkning, overstyring, dårlige komponenter).

I digitale systemer fører forvrængning ofte til robotagtig, hakkende eller metallisk lyd, især ved lav båndbredde og dårlig netværkskvalitet. I analoge systemer kan forvrængning skabe uønskede overtoner eller klipping, hvilket påvirker lydens naturlighed.

Code Division Multiplexing

Code division multiplexing (CDM) er en multiplex teknik der bruger “spread spectrum communication” . Spread spectrum communication fungerer på den måde at et NarrowBand (NB) signal spredes ud over et større frekvensbånd og på tvær af flere kanaler ved at opdele signalet. Det begrænser ikke båndbreddens digitale signal eller frekvenser. Ved at opdele signalet på den måde, bliver det mindre modtagelig over for interferens og giver dermed bedre og sikrere datakommunikation .

Code Division Multiple Access

Når CDM bliver brugt til at tillade at flere signaler fra flere brugere for at kunne dele en fælles kommunikationskanal, kaldes det for Code Division Multiple Access (CDMA). Hver gruppe af brugere får udstedt en fælles kode og individuelle samtaler bliver kodet i en digital sekvens. Data er tilgængelig på den delte kanal, men kun de brugere der kender en bestemt kode kan tilgå data.

Idéen

Hver kommunikationsstation bliver tildelt en unik kode. Kodestationerne har følgende attributter:

  • Hvis koden fra én station bliver ganget med koden fra en anden station bliver udbyttet 0.
  • Hvis koden fra en station bliver ganget med sig selv, bliver udbyttet et positivt tal der er lig med antallet af stationer.

Man kan forklare det teknisk som følgende eksempel:

Forstil dig at der findes fire stationer: W, X, Y og Z. Disse har fået udstedt koderne kw , kx, ky and kz og skal sende data dw , dx, dy og dz. Hver station ganger sin kode med dets data og summen af alle vilkår bliver afsendt i kommunikationskanalen.

Tager vi stationerne og data i eksemplet her, bliver data i kommunikationskanalen:

 dw . kw+ dx . kx+ dy . ky+ dz . kz

Hvis vi antager at ved modtagerenden, Station Z gerne vil modtage data sendt fra Station Y. Så skal Station Z, for afkode signalet og modtage data, gange det modtagne datamed koden fra Station Y dy.

data = (dw . kw+ dx . kx+ dy  . ky+ dz . kz  ) . ky
	  =	dw . kw . ky + dx . kx . ky+ dy . ky . ky+ dz . kz . 
ky	  =0 + 0 + dy . 4  + 0 = 4dy

Ved hjælp af ovenstående udregning kan man se at Station Z kun har fået data fra én Station, nemlig Y, mens den har set bort fra de andre koder.

Ortogonale sekvenser

Koderne der er udsted til stationerne er omhyggeligt genererede koder der kaldes chip-sekvenser eller i mere daglig tale kaldes de ortogonale sekvenser. Sekvenserne består af +1 eller -1. De har visse egenskaber for at kunne tillade kommunikation.

Ortogonale egenskaber:

  • Én sekvens har m elementer, hvor m er antallet af stationer.
  • Hvis en sekvens ganges med et tal, bliver alle elementer ganget med dét tal.
  • For at gange to sekvenser, ganges de tilsvarende positionelle elementer og summeres for at få resultatet.
  • Hvis en sekvens bliver ganget med sig selv er resultatet m(som i antallet af stationer).
  • Hvis en sekvens ganges med en anden sekvens er resultatet 0.
  • For at tilføje to sekvenser, skal man tilføje tilsvarende positionelle elementer.

Lad os prøve at fastslå ovenstående egenskaber gennem et eksempel. (Det her bliver lidt langhåret, men jeg håber I kan se idéen)

Lad os antage følgende ortogonale sekvens for, de fire stationer fra før, W,X,Y og Z:

[+1 -1 -1 +1], [+1 +1 -1 -1], [+1 -1 +1 -1] og [+1 +1 +1 +1]
  • Hver sekvens har fire bestanddele.
  • Hvis [+1 -1 -1 +1bliver ganget med 6 får vi [+6 -6 -6 +6]. = 6
  • Hvis [+1 -1 -1 +1] bliver ganget med sig selv, altså: [+1 -1 -1 +1]. [+1 -1 -1 +1], får vi+1+1+1+1 = 4, som er lig med antallet af stationer.
  • Hvis [+1 -1 -1 +1] bliver ganget med [+1 +1 -1 -1], får vi +1-1+1-1 = 0
  • Hvis [+1 -1 -1 +1] bliver tilføjet til [+1 +1 -1 -1], får vi [+2 0 -2 0].

Som I kan se i eksemplet bevises påstandene om de Orthogonale egenskaber, som er grundprincipperne i teknologien CDMA for hvordan kommunikation kan deles over flere kanaler ved at sprede signalet over flere frekvensbånd og samtidig sikre at det kun er rette modtager der får afsenders data.