Sterrekunde

Hoe skat u die fout op die hoogte / breedte van 'n Gaussier?

Hoe skat u die fout op die hoogte / breedte van 'n Gaussier?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Ek probeer Gaussers pas by verskillende lyne in 'n spektrum wat ek het. Sommige van hulle oorvleuel mekaar, wat veroorsaak dat die toepaslike program wat ek gebruik, nie redelike ramings kan gee vir die foute op die metings nie. Byvoorbeeld, soms sal die breedte van die spektrumlyn 0,5 GHz wees, maar die onsekerheid by 1 000 GHz gee.

Om dit reg te stel, het ek handmatige beramings gedoen oor die beramings wat dit nie kan kry nie. Ek het gelees dat u die fout op die hoogtepunt van die Gaussier kan skat met:

Piekfout = (1/2) * (Breedte / sein-tot-ruis-verhouding)

maar ek kan niks vir die hoogte of breedte vind nie. Is daar soortgelyke maniere om die onsekerheid oor hierdie metings te skat?

Dankie.


As u die aantal oorvleuelende Gauss-funksies ken, kan u dit skryf as $ sum_ {i = 1} ^ n a_ie ^ {- ( frac {x- mu_i} { sigma_i}) ​​^ 2} $ en trek dan af u tydreeks, met meer as $ 3i $ items, om die risiko van 'n slegte probleem te verminder. Pas dan 'n minimale / vierkante metode vir wortelgemiddelde vierkante (RMS) toe om die $ 3i $ parameters af te lei. As dit bekend is dat u FWHM of $ sigma $ dieselfde is vir alle pieke, verminder u aantal parameters tot $ 2i + 1 $.

Sien ook Rietveld-verfyning as 'n verwante benadering.


U kan scipy.optimize.curve_fit gebruik: Hierdie metode gee nie net die geskatte optimale waardes van die parameters nie, maar ook die ooreenstemmende kovariansiematriks:

Optimale waardes vir die parameters sodat die som van die kwadraat residue van f (xdata, * popt) - ydata geminimaliseer word

Die geskatte kovariansie van popt. Die diagonale gee die variansie van die parameterskatting. Gebruik perr = np.sqrt (np.diag (pcov)) om een ​​standaardafwykingsfout op die parameters te bereken.

Die invloed van die sigma-parameter op die geskatte kovariansie hang af van die absolute_sigma-argument, soos hierbo beskryf.

As die Jacobiaanse matriks by die oplossing nie 'n volle rang het nie, gee die 'lm'-metode 'n matriks wat gevul is met np.inf, aan die ander kant' trf 'en' dogbox'-metodes gebruik Moore-Penrose pseudoinverse om die kovariansie te bereken. matriks.

U kan die standaardafwykingsfoute van die parameters vanaf die vierkantswortels van die diagonale elemente van die kovariansiematriks soos volg bereken:


Gaussiese verspreidingsfunksie

As die aantal gebeure baie groot is, kan die Gaussiese verspreidingsfunksie gebruik word om fisiese gebeure te beskryf. Die Gaussiese verdeling is 'n deurlopende funksie wat die presiese binomiale verspreiding van gebeure benader.

Die getoonde Gaussiese verdeling word genormaliseer sodat die som oor alle waardes van x 'n waarskynlikheid van 1. gee. Die aard van die gaussiese gee 'n waarskynlikheid van 0.683 om binne een standaardafwyking van die gemiddelde te wees. Die gemiddelde waarde is a = np waar n die aantal gebeurtenisse is en p die waarskynlikheid van enige heelgetal van x (hierdie uitdrukking word oorgedra vanaf die binomiale verdeling). Die standaardafwykingsuitdrukking wat gebruik word, is ook die van die binomiale verdeling.

Die Gaussiese verspreiding word ook algemeen die "normale verspreiding" genoem en word dikwels beskryf as 'n "klokvormige kromme".

Hierdie berekening is ontwerp vir die evaluering van die gemiddelde waarde en standaardafwyking en om die waarde van die verspreidingsfunksie te bereken indien 'n waarde x verskaf word. As u dit byvoorbeeld gebruik het om 100 muntblaaie te evalueer vir die aantal "koppe", sou die waarskynlikheid vir 'n enkele muntstuk 0,5 wees en die gemiddelde waarde van koppe vir 100 keer sal 50 wees. Maar die standaardafwyking is 5, dus sal u 'n waarskynlikheid van 0,683 hê tussen 45 en 55 koppe. Die waarskynlikheid sal ongeveer 0,08 wees om presies 50 koppe te hê. Maar as u die waarde van die verspreidingsfunksie vir waardes van 45 tot 55 evalueer en dit som, is die som 0,7295, dus hierdie aantal gebeure is nie groot genoeg om die Gaussiese benadering te gee om presiese resultate te gee nie. Die uitvoering van dieselfde reeks berekeninge met behulp van die binomiale verspreiding lewer 0,7287, dus geen berekening vir hierdie grootte steekproef pas by die teoretiese Gaussiese projeksie nie.


As u 'n Gaussiese pas, is die berekening van μ en σ 'n groot probleem. U het u verwysing aangehaal (dankie!), Maar dit nie gevolg nie. Voer wiskunde in en vervang hierdie twee reëls in u kode:

(Dit blyk dat die gemiddelde 'n getal tussen -7200 en 10.000 is, dat die pas nog steeds mooi konvergeer, en ook vir positiewe sigmas minder as 805.)

U mag lmfit (http://lmfit.github.io/lmfit-py/) nuttig vind vir hierdie soort probleme. Dit het ingeboude modelle vir algemene piekvorms soos Gaussies en vereenvoudig baie kromme-pas take. U voorbeeld sal so lyk (die data oorslaan):

wat die geskikte verslag van

en lewer 'n plot wat goed pas.

Let daarop dat die definisie van Gaussies effens anders is, en dat u a ooreenstem met die waarde van die hoogte hierbo. Die waarde wat as amplitude gelys word, is die geïntegreerde area.


Die reëls vir die verspreiding van foute geld vir gevalle waar ons in die laboratorium is, maar die verspreiding van foute is tydrowend. Die reëls vir beduidende syfers laat 'n baie vinniger metode toe om resultate te kry wat ongeveer korrek is, selfs as ons geen onsekerheidswaardes het nie.

'N Beduidende syfer is elke syfer 1 tot 9 en enige nul wat nie 'n plekhouer is nie. In 1.350 is daar dus 4 beduidende syfers, aangesien die nul nie nodig is om die getal sinvol te maak nie. In 'n getal soos 0,00320 is daar 3 beduidende syfers - die eerste drie nulle is net plekhouers. Die getal 1350 is egter dubbelsinnig. U kan nie sien of daar 3 beduidende syfers is nie - die 0 word slegs gebruik om die eenhede se plek te hou - of as daar 4 beduidende syfers is en die nul in die eenhede se plek eintlik nul gemeet is.

Hoe los ons onduidelikhede op wat met nulle ontstaan ​​wanneer ons nul moet gebruik as 'n plekhouer sowel as 'n beduidende figuur? Gestel ons meet 'n lengte tot drie beduidende figure as 8000 cm. Op hierdie manier kan ons nie sien of daar 1, 2, 3 of 4 beduidende syfers is nie. Om die aantal belangrike figure duidelik te maak, gebruik ons ​​wetenskaplike notasie, 8 x cm (wat een beduidende figuur het), of 8,00 x cm (wat drie beduidende figure het), of wat ook al onder die omstandighede korrek is.

Ons begin dan met getalle elk met hul eie aantal beduidende syfers en bereken 'n nuwe hoeveelheid. Hoeveel beduidende syfers moet in die finale antwoord wees? As ons lopende berekeninge doen, behou ons die getalle tot baie syfers, maar ons moet die antwoord slegs aan die regte aantal beduidende syfers rapporteer.

In die geval van optelling en aftrekking, kan ons die beste met 'n voorbeeld verduidelik. Gestel een voorwerp word gemeet met 'n massa van 9,9 gm en 'n tweede voorwerp word op 'n ander balans gemeet om 'n massa van 0,3163 gm te hê. Wat is die totale massa? Ons skryf die getalle met vraagtekens op plekke waar ons nie inligting het nie. Dus 9.9. GM en 0,3163? gm. As ons dit byvoeg met die desimale punte wat ons sien

In die geval van vermenigvuldiging of deling, kan ons dieselfde idee van onbekende syfers gebruik. Dus die produk van 3.413? en 2.3? kan in lang hand geskryf word as

Die kort reël vir vermenigvuldiging en deling is dat die antwoord 'n aantal beduidende syfers sal bevat wat gelyk is aan die aantal beduidende syfers in die inkomende getal met die minste aantal beduidende syfers. In die voorbeeld hierbo het 2.3 twee beduidende syfers gehad terwyl 3.413 4 gehad het, dus word die antwoord gegee aan twee beduidende syfers.

Dit is belangrik om hierdie konsepte in gedagte te hou as u sakrekenaars met 8 of 10 syfers gebruik, om foute in u antwoorde te vermy en die toorn van fisika-instrukteurs oral te vermy. 'N Goeie prosedure om te gebruik is om alle syfers (betekenisvol of nie) deur die hele berekening te gebruik en om die antwoorde af te rond tot toepaslike "sig fig."

Probleem: Hoeveel beduidende syfers is daar in elk van die volgende? Antwoord

(i) 0,00042 (ii) 0,14700 (ii) 4,2 x (iv) -154,090 x


Formule vir die berekening van die aantal teoretiese plate

N, die aantal teoretiese plate, is een indeks wat gebruik word om die prestasie en effektiwiteit van kolomme te bepaal, en word bereken met behulp van vergelyking (1).

・ ・ ・ 1) waar tr: retensietyd, en W: piekwydte

Hierdie piekwydte, W, is gebaseer op die basislyn-afsnitte van raaklyne tot 'n Gaussiese piek, wat gelykstaande is aan die piekwydte op 13,4% van die piekhoogte.
Om die berekening te vereenvoudig en nie-Gaussiese pieke te akkommodeer, word die volgende berekeningsmetodes in die praktyk gebruik.

1. Tangentlynmetode

Piekwydte is die afstand tussen punte waar lyne wat raak aan die linker- en regterbuigpunte van die piek die basislyn sny, en word bereken met behulp van vergelyking (1). Die USP (United States Pharmacopeia) gebruik hierdie metode. Dit het klein N-waardes tot gevolg as die piekoorvleueling groot is.

Dit bied ook 'n probleem as die piek verdraai word, sodat dit verskeie buigpunte het.

2. Half Peak Hoogte Metode

Breedte word bereken vanaf die breedte op die helfte van die piekhoogte (W0.5). Aangesien breedte maklik met die hand bereken kan word, is dit die metode wat die meeste gebruik word. Dit is die metode wat gebruik word deur die DAB (German Pharmacopeia), BP (British Pharmacopeia) en EP (European Pharmacopeia).

Die Japanse farmakopee 15de hersiening wat in April 2006 uitgereik is, het die koëffisiënt verander van 5.55 na 5.54.
(LCsolution laat die koëffisiënt toe via die [Kolomprestasie] -instelling, waar die berekeningsmetode vir 5.54 "JP" is en vir 5.55 "JP2."
Vir breër pieke het die halfpiekmetode groter N-waardes tot gevolg as ander berekeningsmetodes.

3. Oppervlaktehoogte-metode

Breedte word bereken uit die piekarea en hoogtewaardes. Hierdie metode bied relatief akkurate en reproduceerbare breedtes, selfs vir verdraaide pieke, maar lei tot ietwat groter N-waardes wanneer die piekoorvleueling beduidend is.

4. EMG-metode (eksponensieel gemodifiseerde Gaussies)

Hierdie metode stel parameters bekend wat pas by die asimmetrie van pieke en gebruik die piekwydte op 10% van die piekhoogte (W0.1). Aangesien dit 'n breedte naby die basislyn gebruik, lei dit tot N-waardes wat groter is as ander metodes vir breë pieke. Verder kan dit nie die breedte bereken nie, tensy die piek heeltemal geskei is.

・ ・ ・ 4) a0.1: Breedte van die eerste helfte van die piek op 10% hoogte b0.1: Breedte van tweede helfte van piek op 10% hoogte

Vergelyking van berekeningsmetodes

Gegewe 'n Gaussiese piek, het elkeen van hierdie berekeningsmetodes dieselfde N-waarde. Normaalweg het pieke egter 'n mate van afskakeling, wat verskillende N-waardes vir verskillende berekeningsmetodes tot gevolg het.
Daarom is die vier berekeningsmetodes met behulp van chromatogramme vergelyk. Profiel A toon 'n tipiese chromatogram (met 'n bietjie stert), terwyl profiel B 'n chromatogram met 'n beduidende stert toon. Die teoretiese aantal plate wat volgens die vier metodes bereken word, word in die onderstaande tabel aangedui. Resultate vir N wissel selfs vir chromatogram A. Ook kan pieke met meer betekenisvolle vervorming, soos op piek 1 in profiel B, lei tot N-waardes wat baie keer verskil.
'N Sleutelfaktor vir die uitvoering van betroubare kwantitatiewe analise is of skeiding moontlik is al dan nie, dus is daar 'n algemene mening dat 'n berekeningsmetode wat breër pieke beoordeel, soos met die stert, meer prakties is. Ongelukkig lyk dit egter asof daar geen konsensus bestaan ​​oor menings rakende N en W.
Gevolglik, as 'n sekere metode reeds vir evaluering gebruik word, is dit waarskynlik verkieslik om dieselfde metode te gebruik om korrelasie te bewerkstellig.

A (ongeveer tipiese piek) B (beduidende stert)
1 2 3 4 1 2 3 4
Half Peak Hoogte Metode 15649 20444 20389 22245 5972 7917 - 9957
Tangent Line Method 14061 18516 20309 21447 5773 7692 5795 9707
Area Hoogte Metode 13828 19207 17917 21020 4084 7845 6217 8641
EMG Metode 10171 15058 14766 17836 1356 - - 4671

'N Koppelteken dui aan dat berekening nie moontlik was nie. In die halfpiekhoogte-metode is 5,54 as die koëffisiënt gebruik.

Shimadzu se LC-werkstasiesagteware kan prestasieverslae uitvoer met behulp van een van die bogenoemde metodes - 1. raaklyn, 2. halwe piekhoogte (5.54), 2 '. halwe piekhoogte (5.55), 3. oppervlaktehoogte, of EMG. Ons beveel aan om die ooreenstemmende resultate van die kolomprestasie saam met analitiese resultate op te neem!


Skat piekwydte vanaf 'n vektor wat 'n superposisie is van 'n onbekende aantal identiese Gaussiese pieke met verskillende hoogtes?

As u 'n vektor het wat 'n superposisie is van 'n onbekende aantal identiese Gaussiese pieke / impulse van onbekende breedte (maar dieselfde breedte) en verskillende amplitudes (met Poisson of Gaussiese geraas), sou iemand weet van 'n metode om dit af te lei breedte?

Bv. kom ons simuleer 'n superposisie van Gaussiese pieke van breedte 5 in R:

As ek hierdie (nie-negatiewe) sein in hierdie grafiek meet, wil ek in staat wees om te skat dat die (konstante) piekwydte w van die boonste Gaussiese pieke in hierdie geval 5 was (sonder om vooraf hul amplitude / hoogtes of die ware aantal pieke of hul posisie, maar as ons aanneem dat almal identies gevorm is, maar Gaussers anders geskaal het). Enigiemand dink aan hoe om dit op die doeltreffendste manier te doen? Sou dit moontlik wees bv. van die DFT of iets? Of deur 'n yl spitstrein te skat op grond van 'n covariate matriks / woordeboek met tydelik verskuifde Gaussiese pieke van verskillende breedtes en te kyk watter klas piekwydte die meeste gekies word op grond van sê ortogonale ooreenstemmende strewe of 'n LASSO-regressie? Enige gedagtes? Ek het net 'n rowwe skatting nodig, dit hoef nie akkuraat te wees nie, maar ek wil graag hê dat dit vinnig moet wees.

REDIGERING: Een algoritme waarvan ek weet, maar wat meer doen as wat ek wil hê deurdat dit die beste piekvorm skat wat die sein verklaar, is die van de Rooi & amp Eilers (2011) wat in hierdie R-kode geïmplementeer word:

In die geval van die L0-norm is die gereguleerde / beste deelversameling gekies, en ek vind hierdie artikel volgens my 'n verdere ontwikkeling van die Eilers-metode:

Probleme met hierdie algoritme is dat (1) die pasvorm nie baie stabiel is in terme van konvergensie-eienskappe nie, (2) daar is twee reguleringsparameters om in te stel, (3) dat die piekvorm nie beperk is om Gaussies te wees nie (kan opgelos word deur pas Gaussies op afgeleide piekvorm na elke iterasie, maar miskien is daar 'n beter manier ??) en (4) die algo is stadig (150 s vir hierdie klein voorbeeld op my skootrekenaar). So ideaal gesoek, soek ek iets meer robuust en vinniger.


Beeldverhouding

Om verhoudings in verskillende mediums te pas, is ontwerpers dikwels 'n uitdaging, veral as hulle die inhoud moet sny en omskep.

Gelukkig het ek 'n aspekverhouding sakrekenaar maak dinge makliker. As u aan 'n digitale video werk, is dit noodsaaklik om die lêers van die digitale video aanvanklik saam te pers om dit te kan doen kry die akkurate afmetings (of beeldverhoudings) van die video.

Dit verg baie berekeninge. En dit is waar 'n aspekverhouding sakrekenaar inkom om hierdie berekeninge akkuraat te maak. Om presiese formate vir u video te kry, voer net een dimensie in en die sakrekenaar bereken die ander dimensie.


Hoe skat u die fout op die hoogte / breedte van 'n Gaussier? - Sterrekunde

    Definitiewe integrale (Hoërskool materiaal):

      'N Definitiewe integraal a & int b f (x) dx is die integraal van 'n funksie f (x) met vaste eindpunt a en b:

        Die reghoekmetode (ook die middelpuntreël genoem) is die eenvoudigste metode in Wiskunde wat gebruik word om 'n benadering van 'n bepaalde integraal te bereken.

          Verdeel die interval [a .. b] in n stukke elke stuk het dieselfde breedte:

      Die breedte van elke stuk van die kleiner tussenposes is gelyk aan:

      Die oppervlakte van 'n reghoek is gelyk aan:

      Ons ken (reeds) die breedte van elke reghoek:

          Die verskillende reghoeke het verskillende hoogtes

            Eerste (klein) interval: [a .. (a + breedte)] (onthou dat: breedte = (b & minus a) / n)

          Daarom: hoogte van eerste reghoek = f (a)

              die tweede (klein) interval is [(a + breedte) .. (a + 2wydte)] (onthou dat: breedte = (b & minus a) / n)

            Daarom: hoogte van eerste reghoek = f (a + breedte)

                die derde (klein) interval is [(a + 2width) .. (a + 3width)] (onthou dat: width = (b & minus a) / n)

              Daarom: hoogte van eerste reghoek = f (a + 2wydte)

                • Hoogte van reghoek 1 = f (a + 0 & tydbreedte)
                • Hoogte van reghoek 2 = f (a + 1 & tydbreedte)
                • Hoogte van reghoek 3 = f (a + 2 & tydwydte)
                • .
                • Hoogte van reghoek n & minus1 = f (a + (n & minus2) & tydwydte)
                • Hoogte van reghoek n = f (a + (n & minus1) & tydwydte)

                Let wel: daar is in totaal n (kleiner) interval.

                    Hierdie figuur help u om die samestelling te visualiseer:

                    Ons het voorheen 'n algoritme vir berekening van die lopende som gesien wat in eenvoudige getallereekse byvoeg:

                      Bereken die som: 1 + 2 + 3 +. + n

                    Voorbeeld: bereken 1 2 + 2 2 + 3 2 +. + i 2 +. + n 2

                        Die eerste term in die som = i 2

                        Ons kan die lopende som-algoritme gebruik om die som van die oppervlakte van die reghoeke te bereken

                        Ru algoritme (pseudokode):

                      openbare klas RectangleMethod01 1 & int 2 x 3 dx n = 1000 // Gebruik groter waarde vir beter benadering / * -------------------------------- ------------------- Die reghoekreëlalgoritme --------------------------- ------------------------ * / w = (ba) / n // Bereken breedte som = 0,0 // Duidelike lopende som vir (i = 1 i x_i = a + (i-1) * w som = som + (w * (x_i * x_i * x_i)) // f (x_i) = (x_i) 3> System.out.println ("Benaderde integrale waarde # 00a000 "> Voorbeeldprogram: (demo-kode hierbo) & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp wees het

                          Regskliek op die skakel en stoor dit in 'n krapgids

                        openbare klas RectangleMethod02 1 & int 2 (1 / x) dx n = 1000 // Gebruik groter waarde vir beter benadering / * ----------------------------- ---------------------- Die reghoekreëlalgoritme ------------------------ --------------------------- * / w = (ba) / n // Bereken breedte som = 0,0 // Wis lopende som vir ( i = 1 i x_i = a + (i-1) * w som = som + (w * (1 / x_i)) // f (x_i) = 1 / x_i> System.out.println ("Benaderde integrale waarde # 00a000 "> Voorbeeldprogram: (demo-kode hierbo) & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp wees het

                            Regskliek op die skakel en stoor dit in 'n krapgids

                            Verskil in benaderings as u 'n ander aantal reghoeke gebruik:

                              As u meer reghoeke gebruik, kan die algoritme meer getalle byvoeg

                                In rekenaaralgoritmes kan 'n meer akkurate resultaat dikwels verkry word deur 'n langer lopende uitvoering van dieselfde algoritme

                              U kan die verskynsel van afruil ervaar deur n = 1000000 in bogenoemde algoritme te gebruik.


                              Hoe bereken ek die aantal teoretiese plate in gaschromatografie?

                              Daar is verskillende formules, maar die mees algemene berus op die aanname dat die pieke Gaussiese kurwes is.

                              Verduideliking:

                              Die aantal teoretiese plate # n # is die aantal diskrete distillasies wat uitgevoer sal moet word om 'n ekwivalente skeiding te verkry.

                              Gaschromatografiekolomme het normaalweg # 10 ^ 3 # tot # 10 ^ 6 # teoretiese plate.

                              Die aantal teoretiese plate hou verband met die retensietyd, # t_r #, en die breedte van die piek wat die verbinding bevat.

                              As die pieke redelik simmetries is, kan aanvaar word dat dit 'n Gaussiese vorm het. Dan

                              waar #w_ (1/2) # die piekwydte op halfhoogte is.

                              U vind die piekwydte op halfhoogte deur 'n lyn vertikaal van die piekmaksimum tot by die basislyn te teken, half op die piek te meet, 'n horisontale lyn te teken en die lengte van die horisontale lyn te meet.

                              U meet die retensietyd (aangedui as # V_e # vir elueringsvolume) op die punt waar die vertikale lyn wat deur die maksimum getrek word, die basislyn sny.

                              Beide # t_r # en # w_ (1/2) # moet in dieselfde eenhede gemeet word.

                              'N Chromatogram uit 'n sekere kolom het 'n piek met 'n #w_ (1/2) # van 12 mm en 'n # t_r # van 650 mm, soos gemeet op die grafiek. Wat is die aantal teoretiese plate?

                              #n = 5.54 (t_r / w_ (1/2)) ^ 2 = 5.54 ((650 kanselleer ("mm")) / (12 kanselleer ("mm"))) ^ 2 = "16 250 teoretiese plate" #