PLoS ONE: Bayesianske Netværk for Klinisk Beslutningsstøtte i lungekræft Care

Abstrakte

Survival forudsigelse og behandlingsvalg i lungekræft pleje er kendetegnet ved en høj grad af usikkerhed. Bayesianske Netværk (BNS), hvilket naturligvis ræsonnere med usikker domæneviden, kan anvendes til at hjælpe lungekræft eksperter ved at give personlige overlevelse estimater og anbefalinger udvælgelse behandling. Baseret på den engelske Lung Cancer Database (LUCADA), vi vurdere mulighederne for BNS for disse to opgaver, mens sammenligne opførelser af forskellige kausal opdagelse tilgange at afdække den mest gennemførlige netstruktur fra ekspertviden og data. Vi viser først, at BN struktur fremkaldte fra klinikere opnår en skuffende areal under ROC-kurven på 0,75 (± 0,03), hvorimod en struktur lært af CAMML hybrid kausale opdagelse algoritme, som klæber med den tidsmæssige begrænsninger, opnår 0,81 (± 0,03) . For det andet, vores kausal interven- resultater viser, at BN behandlingsrekommandationer, baseret på foreskrive behandlingsplan, der maksimerer overlevelse, kun kan forudsige indspillede behandlingsplan 29% af tiden. Men denne procentdel stiger til 76%, når delvise kampe er inkluderet.

Henvisning: Sesen MB, Nicholson AE, Banares-Alcantara R, Kadir T, Brady M (2013) Bayesian Networks for Klinisk Beslutningsstøtte i Lung Cancer Care. PLoS ONE 8 (12): e82349. doi: 10,1371 /journal.pone.0082349

Redaktør: Raffaele A Calogero, University of Torino, Italien

Modtaget: August 29, 2013; Accepteret: 30 Oktober 2013; Udgivet: December 6, 2013 |

Copyright: © 2013 Sesen et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Denne forskning er blevet finansieret af Clarendon og New College Graduate Stipendier gennem CDT i Healthcare innovation på Biomedical Engineering Institute på University of Oxford. MB anerkender støtte fra theCancer Research Storbritannien /Teknik og naturvidenskab Forskningsråd Oxford Cancer Imaging Center. AN anerkender finansiering fra FEDER midler og den spanske regering (Ministerio de Ciencia e Innovación) gennem projektet TIN2010-20900-C04-03. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:. Forfatterne vil gerne erklære, at en af ​​forfatterne, TK, er ansat ved den kommercielle firma: Mirada Medical. Det betyder dog ikke volde interessekonflikter i forbindelse med arbejde præsenteres. Desuden vil forfatterne gerne understrege, at dette ikke ændrer deres tilslutning til alle PLoS ONE politikker om datadeling og materialer.

Introduktion

Den accelererende tendens til skræddersyet medicin, parallelt med den hurtige udvikling af forskellige maskine læring (ML) værktøjer, har udløst udnyttelsen af ​​medicinske datasæt til at foreslå diagnostiske og prognostiske muligheder, til det punkt, selv for anbefale individualiserede behandling planer [1,2]. I forbindelse med klinisk beslutningsstøtte (CDS), der ML værktøjer bruges til at hjælpe de klinikere ankommer mere informerede beslutninger behandling baseret på tidligere patientjournaler. Sådanne systemer fungerer typisk ved at matche en patientjournal til de oplysninger, “lært” fra tidligere patientjournaler for hvilke foreskrevne behandling planer og patientresultater er kendt.

Medicinske datasæt normalt kendetegnet ved deres ufuldstændige og noisiness, som forårsager en betydelig grad af usikkerhed under behandling af dem [2]. Samlet set gennemsyrer usikkerhed kausalitet i medicin, selv om det ikke altid er udtrykkeligt. For eksempel i et datasæt, der indeholder ‘Age “og” Survival “, den kausale sammenhæng mellem de to er indlysende, selvom det måske ikke er ligetil at lokalisere hvorigennem variabler det kan fastslås. Endnu vigtigere er, usikkerhed også opstår naturligt i patientpleje processer, der ligger til grund for data, ikke mindst i spørgsmål som: “Hvad er sandsynligheden for overlevelse for denne patient?” Og “Hvordan forskellige behandling beslutninger påvirker denne sandsynlighed?”

et godt eksempel på et klinisk miljø, hvor usikkerheden er allestedsnærværende, er behandlingsvalg i kræft pleje, hvor den forskelligartede karakter af de egenskaber patient- og sygdom og det hastigt voksende udbud af behandlingsmuligheder ofte tilstedeværende dilemmaer vedrørende optimale behandling beslutninger [ ,,,0],3]. Som en konsekvens af den komplekse og tværfaglige karakter af beslutningsprocessen, er planer for kræftpatienter behandling forvaltes i tværfagligt team (MDT) møder, der mobiliserer fælles ekspertise klinikere fra forskellige specialer.

Personlig overlevelse forudsigelse og behandlingsvalg er fremtrædende i MDT miljø. Forudsigelse af svaret på det første af de ovenstående spørgsmål vedrører prognostisk ræsonnement [4]. En nøjagtig forudsigelse af overlevelse kan bruges til at stratificere kræftpatienter i forskellige risikogrupper og potentielt støtte i udformningen personlige behandling planer [5,6]. Desuden forudsagde overlevelse information kan også være afgørende i forvaltningen patient og familie forventninger på resultaterne behandling [7]. Som en probabilistisk udtryk, kan dette prognostisk spørgsmål blive benævnt “P (Survival = Alive | Evidence) =?”. Ved hjælp af en BN, kan dette spørgsmål besvares via observationelle følgeslutning, hvor fokus er på at opdage den bageste fordeling af forespørgslen variabel:. Overlevelse, betinget af den observerede Beviser for andre noder

På den anden side, den andet spørgsmål, hvilke forespørgsler effekten af ​​behandling markeringer på den prognostiske udfald, omhandler pragmatiske mål om helbredende kræft pleje. Naturligvis hvis prognose for patienten er dårlig, kan det endelige mål være palliation og styring af symptomer, snarere end at øge sandsynligheden for overlevelse. Med hensyn til sandsynlighedsteori, er denne forespørgsel betegnet som “P (Survival = Alive | Beviser, T) =?”, Hvor T repræsenterer behandlingsplanen variabel. I forhold til den tidligere, sigter denne forespørgsel til at finde den bageste fordeling af overlevelse betinget af T, som er – i modsætning til evidens ubemærket på tidspunktet for at stille spørgsmålet. Med andre ord er spørgsmålet hypotetisk og kan ikke besvares blot ved de observerede til dette punkt værdier. For at forudsige, hvad overlevelsessandsynligheden bliver, givet forskellige behandlingsmuligheder, ville vi nødt til at foretage en kausal indgreb, som giver os mulighed for at spørge “Hvad nu hvis?” Spørgsmål. Denne type af kausale ræsonnement er meget vigtigt i CDS-applikationer og er ikke kompatibel med diskriminerende ML metoder såsom regressionsmodeller [8,9].

Bayesian Networks

BNS muliggør kausalt ræsonnement med domæne koncepter i en visuelt tiltalende og mere intuitiv måde i forhold til mange andre ML teknikker [9], og de kan bruges til at løse de ovennævnte kliniske spørgsmål. De koder for usikker domæne viden på en naturlig måde. En BN består af en rettet acyklisk graf (DAG), og et underliggende fælles sandsynlighedsfordeling, som tilsammen giver en matematisk sund og kompakt måde at kode usikkerhed på et givent område. Fra starten har medicinsk informatik været den primære drivkraft i udviklingen af ​​BNS [10,11]. Dette skyldes dels, at deres evne til intuitivt indkapsle årsagssammenhængene mellem de diagnostiske eller prognostiske faktorer, der er gemt i medicinske datasæt [4,12,13].

BNS er egnede værktøjer til probabilistisk slutning, der kan støtte den kliniske beslutningsproces, da en) deres grafiske natur giver de oplysninger, de indeholder den let kan forstås af en kliniker [14]; 2) kan de formelt inkorporere forudgående viden mens lære strukturen og parametre i netværket [15]; 3) de lette parameterestimering på grund af deres kompakte repræsentation af det fælles sandsynlighed rummet; 4) de ikke kun tillade observerende inferens men også kausale indgreb [9]; 5) De kan anvendes til at forespørge en given knudepunkt i netværket og er derfor væsentligt mere alsidige sammenlignet med klassificører bygget baseret på specifikke resultatvariabler; og 6) de klarer sig godt i at gøre forudsigelser med ufuldstændige data, eftersom forudsigelsesvariable anvendes til at vurdere ikke kun forespørgslen variabel, men også hinanden [16] [5,17]. For en detaljeret dækning af BNS, henvises læseren til [9,13].

Den primære motivation med dette arbejde er at undersøge muligheden for at udvikle BNS i at yde beslutningsstøtte for overlevelse forudsigelse og behandlingsvalg i lunge kræftbehandling. Lungekræft er den hyppigste årsag til kræft-relateret dødelighed i hele verden [18] [6]. Vores analyser er baseret på en anonymiseret delmængde af den engelske Lung Cancer database (LUCADA), som omfatter mere end 126.000 patienter, der blev diagnosticeret mellem 2006 og 2010. Vi benytter denne store og unikke datasæt til at udvikle og evaluere en række BNS hvis strukturer er lært igen ved manuel, automatiserede og hybride tilgange. Struktur indlæring af BNS forbliver noget af en sort kunst, og derfor et sekundært mål med papiret er at vurdere egnetheden af ​​forskellige metoder til at afdække den kausale struktur af domænet ved hjælp af en real-life medicinsk datasæt af størrelse og kompleksitet LUCADA.

anmeldelse

Cruz og Wishart [19] rapport, at vedtagelsen af ​​ML teknikker til prognose forudsigelse og valg af behandling er en forholdsvis ny udvikling. Den eksisterende litteratur om BNS og kræft primært vedrører applikationer til at støtte diagnose, risikovurdering og overlevelse forudsigelse. Desuden mellem forskellige cancer-domæner, der har været koncentreret om applikationer i brystkræft [20-24] i forhold til BN applikationer i andre typer af kræft [5,7,25-28].

Med hensyn til relevante BN applikationer på overlevelse forudsigelse, i en undersøgelse offentliggjort i 2011, som har til formål at forudsige den 1-årige levetid af 189 patienter med knoglemetastaser, Forsberg et al. opnået gode prædiktiv ydelse med et areal under ROC-kurven (AUC) på 0,83 [7]. I en nyere undersøgelse baseret på en væsentlig større datasæt indeholdende 146,248 patientjournaler, Stojadinovic et al. bygget en BN til at udføre personlig overlevelse forudsigelse for tyktarmskræft, rapportering en AUC-værdi på 0,85 [16]. Ingen af ​​disse undersøgelser sammenlignet egnetheden af ​​forskellige tilgange i den kausale opdagelsen af ​​domænet struktur. Desuden både kausale interventioner og mulighederne for behandling anbefalinger fra BNS var ude af anvendelsesområdet for begge undersøgelser.

Med fokus på lungekræft specifikke anvendelser af BNS, i 2010 Jayasurya et al. designet en BN for at forudsige overlevelse i ikke-småcellet lungekræft (NSCLC) patienter behandlet med strålebehandling. De konkluderede, at BN modeller opnår en højere prædiktiv ydeevne med manglende data, sammenlignet med support vektormaskine og er derfor mere egnet til medicinsk domæne [5]. I en mere teknisk orienteret publikation, Oh et al. foreslået en BN struktur læring algoritme, der kombineret både fysiske og biologiske faktorer til at forudsige den lokale fejl i lungekræft [27]. Imidlertid blev begge af disse undersøgelser er baseret på datasæt, der indeholdt et begrænset antal patientjournaler -for en undersøgelse i [27] kun 18 patients- nødvendiggør replikation på større datasæt.

Sammenfattet antal undersøgelser rapporterer anvendelsen af ​​BNS til cancer er begrænset. Desuden bortset fra en håndfuld undtagelser, mest publicerede resultater er fra indledende undersøgelser på baggrund af data begrænsede patient. Til vores viden, ingen forudgående arbejde, som tager hensyn til histologiske, kliniske og demografiske oplysninger baseret på en national datasæt af størrelsen af ​​LUCADA eksisterer i overlevelse forudsigelse eller behandling anbefaling i lungekræft.

Materialer og metoder

The National Lung Cancer Audit (NLCA) har været at indsamle elektroniske patientdata i engelske Lung Cancer Database (LUCADA) siden 2004. Gennem en aftale deling af data mellem NLCA og University of Oxford, har vi haft adgang til anonymiseret delmængde af LUCADA datasæt for at udføre forskning i de biomedicinske tekniske områder af klinisk beslutningsstøtte og machine learning. Dette datasæt indeholder 126,986 engelske patientjournaler indtastes i systemet fra starten af ​​2006 til slutningen af ​​2010. Alle potentielt patientdata identificerbare data blev fjernet af NLCA inden du gør dataene tilgængelige.

Da LUCADA indsamles primært til revision, det indeholder mange administrative variabler, der er af tangential interesse for denne undersøgelse. Baseret på input fra vores kliniske samarbejdspartnere og litteratur, vi fokuserede vores analyser på de 13 hyppigst forekommende LUCADA variabler i de store nationale og internationale lungekræft pleje vejledende dokumenter [6,29-31]. Ud over deres kliniske relevans blev disse udvalgt på grundlag af at være til rådighed på det tidspunkt en ny patient præsenteres til afgørelse behandling til MDT. Disse variabler er angivet i tabel 1.

Code

navn

Værdier

Temporal Tier

1Age 50; 50-60; 60-70; 70-80; 80Pre-treatment2Staging Identifier6; 7Pre-treatment3FEV1 Absolute Beløb 1,0; 1-1,5; 1.5 – 2.0; 2.0Pre-treatment4FEV1 Procent 30; 30-40; 40-80; 80Pre-treatment5Performance Status0; 1; 2; 3; 4PRE-treatment6Number af Comorbidities0; 1; 2; 3; 4; 5Pre-treatment7Primary DiagnosisC33; C34; C34.0; C34.1; C34.2; C34.3; C34.8; C34.9; C38.4; C38.3; C38.8Pre-treatment8Tumour LateralityLeft; Højre; midterlinjen; Bilateral; Ikke ApplicablePre-treatment9TNM CategoryIA; IB; IIA; IIB; IIIA; IIIB; IV; UncertainPre-treatment10HistologyM8010 /2; M8041 /3; M8046 /3; M8070 /3; M8140 /3; M8250 /3; M8012 /3; M8020 /3; M8013 /3; M8240; M8980 /3; M8940 /3; M9999 /9Pre-treatment11Site-specifikke Staging ClassificationLimited; Stor; UnknownPre-treatment12Suggested kræftbehandling planListed i tabel 2Treatment131-yr SurvivalAlive; DeadPost-treatmentTable 1. De 13 patient- og sygdomsspecifikke variabler fra LUCADA, sammen med de værdier, de kan tage, og deres tidsmæssige ordrer.

CSV Hent CSV

I tabel 1, de første 11 variabler er kategoriseret som “præ- behandlingsvariabler “. De indeholder oplysninger om patienten eller sygdomsspecifikke aspekter af en patientjournal, der er nødvendige, før en beslutning behandling foretages. Blandt de patientrelaterede detaljerne opført: »Ydelse status ‘angiver generelle fysiske velvære, mens’ FEV1 absolutte mængde” og “FEV1 Procent ‘gemme lungekapaciteten (mere præcist, tvang ekspirationsvolumen i 1 sekund) af en patient. Desuden ‘Antal co-morbiditet’ giver oplysninger om antallet af signifikante co-morbiditet, såsom hjertekarsygdomme og renal dysfunktion, at en patient har på tidspunktet for diagnosen.

Blandt de sygdomsspecifikke variabler “Primær diagnose« identificerer ICD-10 kode [32], der bedst beskriver placering og den generelle type af sygdommen. “Histologi« angiver SNOMED koden [33] af histo-patologiske typen af ​​den primære tumor, og amerikanske Blandede Cancer (AJCC) defineret ‘TNM kategorien “opsummerer den overordnede sværhedsgrad af sygdommen i form af tumorstørrelse og spredning af kræftceller. Tilsvarende ‘site-specifikke Staging Klassifikation’ butikker om sygdommen er begrænset eller omfattende for patienter småcellet lungecancer.

Den “Foreslået kræftbehandling plan ‘variable gemmer behandling gives til patienten. Den endelige behandling for ikke-metastatisk lungecancer er kirurgisk resektion. Men da de fleste patienter kun er diagnosticeret, når sygdommen er på et fremskredent stadium, kun 10-15% af patienterne kan behandles med kirurgi [34,35]. Tabel 2 viser alle tilgængelige behandling planen typer inden LUCADA, sammen med deres frekvenser. I denne tabel, alle behandlingstyper, bortset fra palliativ pleje (5), og Aktiv overvågning (6), er kategoriseret som helbredende behandlinger. Behandlingerne kodede 1, 9, 10 og 11 er dem, der involverer kirurgisk resektion. Resten af ​​de behandlinger, kodet 2, 3, 7 og 8, omfatter individuel kemoterapi og strålebehandling eller en kombination af de to.

Kode

Name

Procent (%)

1Surgery102Radiotherapy14.793Chemotherapy195Palliative care236Active Monitoring97Sequential kemoterapi og radiotherapy78Concurrent kemoterapi og radiotherapy19Induction kemoterapi til downstage før surgery0.0810Neo-adjuverende kemoterapi og surgery0.1311Surgery efterfulgt af adjuverende chemotherapy2-Null14Table 2. De tilgængelige behandling planen muligheder i LUCADA og deres frekvenser.

CSV Hent CSV

Endelig i tabel 1, indeholder ‘1-års overlevelse “variabel information overlevelse resultat for alle patientjournaler. I kræftbehandling, 5-års overlevelse er den mest almindeligt anvendte cut-off punkt for at måle sygdomsfri overlevelse. Da LUCADA endnu ikke indeholder meget patientdata på 5-års overlevelse, bruger vi 1-års overlevelse som surrogat resultat foranstaltning. Dette valg blev støttet både af vores kliniske samarbejdspartnere og af litteratur, som rapporterer næsten alle forbedringer i lungekræft overlevelse som kan henføres til en stigning i 1-års overlevelse [36,37]. Den overordnede ‘1-års overlevelse’ sats inden LUCADA er 33%.

Pre-behandling af LUCADA datasæt

Før designe et sæt af domænespecifikke BNS, vi analyserede først og forbehandlet den LUCADA datasættet. Data, præ-behandlingen er et afgørende skridt i enhver maskine læring øvelse, da pålideligheden af ​​en prædiktiv model høj grad afhænger af kvaliteten af ​​data, der anvendes [38]. Til dette formål har vi gennemført følgende præ-behandlingstrin.

Først fjernede vi manuelt de registreringer, hvor patienten blev diagnosticeret med mesotheliom, da vores fokus var på NSCLC og småcellet lungekræft (SCLC) patienter . Desuden har vi fjernet de patientjournaler, som indspillede behandlingsplan var brachyterapi (mindre end 100 patienter, hvilket gør det usandsynligt), eller der var ikke 1-års overlevelse oplysninger. Disse sletninger reduceret antallet af observationer til rådighed i datasættet fra 126.987 til 117.426.

For det andet, vi diskretiseres de “

Age

“, “FEV1 Procent” og “FEV1 absolutte beløb” datafelter, som er de eneste ikke-kategoriske felter i LUCADA datasættet. Selv om det er muligt at bygge BNS med kontinuerte variable, de fleste kliniske anvendelser til dato udnytte kategoriske variabler [4]. Disse tre variabler blev diskretiseres baseret på kliniker rådgivning og de afskårne værdierne i de vejledende regler. Selv om der er forskellige teknikker til automatisk diskretisering af kontinuerte variabler [39-41], tilgængeligheden af ​​afskæringsværdier inden de vejledende dokumenter og klinisk samarbejdspartner rådgivning muligt for os at foretage manuel discretisation baseret på klinisk betydningsfulde intervaller. Disse ekspert fremkaldte intervaller er som anført i tabel 1.

For det tredje har vi udviklet en strategi til at håndtere manglende data, som omfatter 32% af LUCADA. Data, ufuldstændighed er en del af livet til kliniske datasæt [5,42] og afhængigt af, hvordan ufuldstændige en bestemt variabel er relateret til andre variabler, manglende data er almindeligt modelleret baseret på en af ​​tre forskellige antagelser: 1) mangler helt tilfældigt (MCAR); 2) mangler tilfældigt (MAR); eller 3) ikke mangler tilfældigt (NMAR), hvor sidstnævnte omfatter alle de tilfælde, der ikke falder ind under en eller 2, og som sådan nødvendiggør modellering manglende data eksplicit.

De to almindelige metoder til at håndtere MAR data Forventning maksimeringstest (EM) og Multiple Imputation (MI) [43]. har imidlertid det erindres, at både EM og MI er beregningsmæssigt komplekse algoritmer, der måske ikke er muligt for store datasæt med høje ufuldstændige. Endnu vigtigere, deres forbrug afhænger væsentligt af gyldigheden af ​​MAR antagelse, uden hvilket de resulterer i biased estimater [44]. Graham tilråder, at “den bedste måde at tænke på alle manglende data er som et kontinuum mellem MAR og MNAR” og man skal afgøre, om MAR overtrædelse i en given datasæt er stor nok til at gengive de estimater af MI og EM ugyldig [45 ].

informeret af vores interaktioner med NLCA personale, konkluderede vi, at NMAR missingness var fremtrædende i LUCADA og vedtagelsen af ​​EM eller MI kunne have negative virkninger. Som et resultat, vi har valgt at modellere “missingness” udtrykkeligt har givet sammenhæng. Faktisk mangler data mønstre i kliniske datasæt ofte korreleret med den kliniske relevans af de manglende værdier for en bestemt patient, og kan ofte legemliggøre oplysninger [42,46]. For at vurdere, om fraværet af data i LUCADA data kunne give nyttige oplysninger i opbygningen prognosemodeller, kørte vi et sæt eksperimenter på vores valgte 13-variable delmængde med 117,426 patientjournaler.

Til dette formål valgte vi 1-års overlevelse som vores binære udfald variabel og adskilt resten af ​​datasættet som vores forudsigelse matrix. Efter dette, vi udarbejdet en binær ‘indikator matrix «, hvis elementer var nul eller én afhængigt af, om de tilsvarende elementer i den forudsigelse matrix blev observeret eller manglede. Vi input den resulterende indikator matrix i den naive Bayes [47] og Logistisk regression [47] algoritmer og i hvert tilfælde forudsagde 1-års overlevelse. AUC-værdierne og prædiktive nøjagtighed procentdele opnået med oplysninger om data ufuldstændige alene er givet i tabel 3. De rapporterede værdier i tabellen er gennemsnit og standardafvigelser ved 10 gange stratificerede krydsvalidering resultater.

Gennemsnitlig AUC

Std. Dev. AUC

Gennemsnitlig nøjagtighed

Std. Dev. Nøjagtighed

Logistic Regression0.720.024720.37Naive Bayes0.690.021710.36Table 3. Areal under kurven (AUC) og prædiktive nøjagtighed resultater for manglende data indikatoren matrix forudsige 1-års overlevelse resultat.

CSV Hent CSV

Disse resultater viser tydeligt, at manglende data mønster er faktisk meget informative forudsige 1-års overlevelse i LUCADA datasættet. Derfor valgte vi at modellere manglende data eksplicit i vores analyser. Dermed brugte vi PostgreSQL [48] forespørgsler til at erstatte de null observationer i databasen med et eksplicit “Ukendt /Missing” tilstand.

Eksperimentelle metoder

Anvendeligheden af ​​BNS til at forudsige en årig overlevelse i LUCADA datasættet var motiveret ovenfor. Struktur indlæring af de tilknyttede DAG’er kan udføres manuelt eller i nærvær af et omfattende datasæt, via automatiske kausale discovery algoritmer. I vores eksperimenter, vi sammenlignede plausibilitet af DAG strukturer, som var 1) fremkaldt fra klinikere opfattelse af det domæne; 2) lært strengt fra data; og 3) lært via en hybrid tilgang, der inkorporerer den ekspertviden til automatiseret struktur læring.

Ekspert fremkaldte strukturer er meget almindelige i kliniske anvendelser, da de kausale sammenhænge mellem forskellige variabler er godt forstået af klinikere. Lucas et al. rapport, at mange af BNS [28,49-55] udviklet til det virkelige liv applikationer i biomedicin og sundhedsvæsen er blevet bygget manuelt [4]. Men sådanne BNS er tilbøjelige til subjektive skævheder, og kan ikke være i stand til fuldt ud at fange statistiske signaturer (f.eks uafhængigheder), der implicit i dataene. Disse kan resultere i suboptimale modeller, især i tilfælde, hvor det endelige mål er posterior parameterestimering eller klassificering, snarere end at gøre eksplicit de årsagssammenhænge at få en bedre forståelse af problemet domænet.

På den anden side, den automatisk læring af den kausale struktur af en BN fra data er en aktiv udfordring forfulgt i ML, især fordi der ikke er unikke BN, der repræsenterer det fælles sandsynlighedsfordelingen givet af oplysninger [9]. Generelt kan automatisk struktur learning algoritmer kategoriseres i: 1) Constraint-baserede algoritmer, der bruger betingede uafhængigheder; og 2) Score-baserede søgealgoritmer, som søgen efter den DAG model, der maksimerer et metrisk score i den kausale model rummet [13]. Den begrænsning baserede metoder er fokuseret på at inddrive en kausal struktur baseret på betingede uafhængigheder i dataene. I vores eksperimenter vi gjort brug af en forbedret version af afledte Årsagssammenhæng (IC) algoritme, som beskrevet i [56] og gennemført af Bouckaert i WEKA 3 [57].

De score-baserede søgealgoritmer gør brug af nedbrydeligt scorer, der tillader den samlede score for en DAG skal beregnes som summen (eller produkt) af de individuelle node scorer i netværket. I vores eksperimenter, vi gjort brug af K2 score [58], som er en type af Bayesian score [58-60], med henblik på at beregne den samlede sandsynlighed for en graf (G) og datasættet (D) [58] . Den generelle ligning for en Bayesian score er givet i ligning 1.

(1)

Alle automatiserede læring algoritmer præsenteret i dette papir blev gennemført enten i MatLab BNT værktøjskasse [61] eller WEKA 3 [57] machine learning software. Konkret i vores eksperimenter anvendte vi følgende score-baserede søgealgoritmer: 1) Tree Augmented Naïve Bayes (TAN), der blev introduceret af Friedman og Geiger som en lempelse af den stærke uafhængighed antagelse mellem prediktorvariabler i et naivt Bayes klassificeringen [ ,,,0],62]. Den version af TAN, som vi brugte blev gennemført i WEKA 3; 2) K2, som blev foreslået af [58] og gennemført i BNT værktøjskassen; 3) Markov Chain Monte Carlo Model Nedbrydning MC

3, først foreslået af Madigan og York [63] og gennemført i BNT værktøjskassen; og endelig 4) Simuleret Annealing til søgning rummet af alle sandsynlighedsmodeller, som gennemført ved Bouckaert i WEKA 3 [57].

Ud over disse fuldautomatiske algoritmer, vi udforskede også brugen af ​​en hybrid struktur læring algoritme, opkaldt Causal Minimum Message Længde (CaMML) [64], som gør det muligt forskellige typer af ekspertviden, såsom tidsmæssige niveauer (A sker før B, betegnet som A ≺ B), direkte forbindelser (A og B er relateret, betegnet A – B) og direkte årsagssammenhænge (En direkte indflydelse B, betegnet som A → B), der skal indarbejdes i automatiserede læreproces. For struktur læring, vi brugte Java gennemførelsen af ​​CaMML, udviklet på Monash University. Det er tidligere blevet anvendt af Flores et al. [15] og Twardy et al. [65] for at få kliniske kausale strukturer inden for domænet for kardiovaskulær sygdom. Samlet set en fælles egenskab ved alle de struktur learning algoritmer, der anvendes var, at de alle variable antages at være diskret og datasættet skal overholdes fuldt ud.

forsøgsopstilling

I alle de BN eksperimenter, repræsenterede vi de fælles sandsynlighedsfordelinger hjælp betingede sandsynlighedstabeller (katodestrålerør), som blev lært via maximum likelihood skøn ved at antage ensartede Dirichlet tidligere fordelinger over alle diskrete variable. Denne “udlignede spilleregler” i form af parameterisering. Vi fokuserede vores indsats på at sammenligne variationen af ​​struktur learning algoritmer.

Vi gennemførte alle eksperimenter ved at opdele den valgte 117.426-patient-stærk delmængde af LUCADA i 10 lige store dele med omtrent lige store forudgående resultatet sandsynligheder, hvor sandsynligheden for 1-års overlevelse var 0,33. For hvert BN eksperiment blev strukturen og parameter læring udført på 9 skillevægge og testet på den resterende. Ved iteration denne proces over alle ti partitioner, vi sikret inddragelsen af ​​alle patientjournaler i forsøgene. De opførelser af alle kausale BNS og andre prædiktive modeller blev evalueret baseret på AUC-værdierne og prædiktive nøjagtighed procentdele af disse stratificerede ti-fold cross-valideringer.

Den eksperimentelle set-up, som vi lærte struktur og parametre og rapportere prædiktive effektivitetsmålinger med hver algoritme er sammenfattet i figur 1. For hver fold af cross-validering, vi adskilt datasæt D (xv) ind uddannelse og test sæt. Vi anvendte træningssættet at lære DAG og parametre af BN, og derefter den test, der for at evaluere den prædiktive ydeevne lært struktur. Ifølge denne, repræsenteret vi DAG (xv) for hver fold i form af en logisk nabomatrix. I slutningen af ​​korset validering, vi indtaste DAG array, som bestod af alle strukturer lært under 10 gange validering korset, i en rettet maksimal udspændende træ (MWST) algoritme for at erhverve den resulterende DAG

endelig. Vi gjorde derefter brug af Bayesian Score metriske, givet i ligning 1, for at beregne P (D, DAG

endelig).

pseudo-kode forsøgsopstillingen for læring og evaluering DAG’er via forskellige algoritmer.

Selvom vores primære fokus er på BNS, for at give baseline reference- benchmarks, vi også indberette forestillinger fremstillet ved udbredte Naïve Bayes (NB), Logistisk regression, og C4 .5 beslutningstræ algoritme. I vores eksperimenter, gjorde vi brug af NB algoritme i MatLab R2011a. For Logistisk regression og C4.5 beslutningstræ algoritmer brugte vi WEKA 3 [66]. NB er blevet vedtaget som baseline metrisk i mange ML undersøgelser. På trods af sin enkelhed, er det blevet rapporteret, hvilket gav sammenlignelige resultater til mere sofistikerede ML teknikker, især i nærvær af store datasæt [67,68]. Logistisk regression er almindeligt anvendt i kliniske kohorte undersøgelser og forsøg [69]. Den specifikke implementering af Logistisk regression i WEKA 3 er baseret på brug af “højderyg estimatorer ‘for at forbedre koefficient skøn [70]. C4.5 er en almindeligt anvendt algoritme til opbygning beslutningstræer, der anses for at være særligt egnet til domæner med diskrete variable som vores [71,72]. Den specifikke implementering af C4.5 algoritme, vi brugte i WEKA 3 hedder “J48”.

Inferens

Som understreget tidligere, at en af ​​vores grunde repræsenterer vores domæne som BN er alsidigheden af ​​probabilistisk inferens fra BNS, hvorved indtastning beviser på enhver variabel i netværket resulterer i at opdatere de bageste fordelinger af resten af ​​variablerne. Disse sandsynlighed opdateringer, dvs. tro opdateringer, kan visualiseres på toppen af ​​grafen strukturer, der giver en grad af gennemsigtighed under inferens. Dette adskiller BN følgeslutning fra “black-box” ML processer [9].

I alle vores eksperimentelle resultater, vi gjort brug af Junction Tree algoritmen [73], som hver for sig gennemført af Murphy [61] i MatLab BNT værktøjskasse og ved Bouckaert [57] i WEKA 3. Denne algoritme består af

Be the first to comment

Leave a Reply