PLoS ONE: Patienter & amp; Sundhedspersonale Værdier Med hensyn sandt-& amp; Falsk-positiv diagnose når Kolorektal Cancer Screening af CT kolografi: Diskret valg Experiment

Abstrakt

Formål

For at fastlægge den relative vægtning givet af patienter og sundhedspersonale til gevinster i diagnostisk sensitivitet versus tab af specificitet ved brug af CT-kolografi (CTC) for kolorektal cancer screening.

Materialer og metoder

efter etisk godkendelse og informeret samtykke, 75 patienter og 50 sundhedspersonale foretog en diskret valg eksperiment, hvor de vælge mellem “standard” CTC og “forbedret” CTC, der rejste diagnostisk sensitivitet 10% for enten kræft eller polypper i bytte for varierende niveauer af specificitet. Vi etablerede den relative stigning i falsk-positive diagnoser deltagere handles til en stigning i sand-positive diagnoser.

Resultater

Data fra 122 deltagere blev analyseret. Der var 30 (25%) ikke-handlende for kræft scenariet og 20 (16%) for den polyp scenario. For kræft, blev 10% gevinst i følsomhed handles op til en median 45% (IQR 25 til 85) falde i specificitet, svarende til 2250 (IQR 1250 til 4250) yderligere falsk-positive pr ekstra sand-positiv kræft på 0,2% forekomst. For polypper, var tallet 15% (IQR 7,5-55), svarende til 6 (IQR 3 til 22) yderligere falsk-positive pr ekstra sandt-positive polyp på prævalens 25%. Tipping points var signifikant højere for patienter end fagfolk til både kræft (85 vs 25, s 0,001) og polypper (55 vs 15, s 0,001). Patienterne var villige til at betale væsentligt mere for øget følsomhed for kræft (p = 0,021).

Konklusion

Når screening for tarmkræft, patienter og fagfolk mener gevinster i ægte-positive diagnoser er meget værd mere end de negative konsekvenser af en tilsvarende stigning i falsk-positiver. Evaluering af screeningsundersøgelser bør tage højde for dette

Henvisning:. Boone D, Mallett S, Zhu S, Yao GL, Bell N, Ghanouni A, et al. (2013) Patienter ‘ Sundhedspersonale ‘Værdier Med hensyn sandt- Falsk-positiv diagnose når Kolorektal Cancer Screening af CT kolografi: Diskret Choice Experiment. PLoS ONE 8 (12): e80767. doi: 10,1371 /journal.pone.0080767

Redaktør: Jeroen Hendrikse, University Medical Center (UMC) Utrecht, Holland

Modtaget: August 10, 2013; Accepteret: 13. oktober 2013; Udgivet: 9. december 2013 |

Copyright: © 2013 Boone et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Denne artikel præsenterer uafhængig forskning finansieret af det britiske National Institute for Health Research (NIHR) under sine program Tilskud til anvendt forskning finansieringsordning (RP-PG-0407-10338). Synspunkterne er forfatternes og ikke nødvendigvis af det britiske NHS, det NIHR eller Department of Health. En del af dette arbejde blev foretaget på UCL og UCLH, der modtager en del af midlerne fra finansieringsordning NIHR Biomedical Research Centre

Konkurrerende interesser:. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Forståelse diagnostisk test ydeevne er afgørende for evidensbaseret praksis [1], [2], især til screening, hvor risici og fordele er afbalanceret fint. Ingen screening test er 100% følsomme og konsekvensen forstås let; falsk negative tests vil forsinke eller forhindre helbredelse. Specificitet er vigtigt for screening, fordi de fleste mennesker er sygdomsfri. En falsk-positiv test betyder raske personer kan undergå invasive procedurer der forårsager angst, sygelighed, og endda dødelighed [3]. Tests, der øger andelen af ​​mennesker med sygdom, der testes sandt-positive (øge følsomheden) normalt samtidig øge andelen af ​​mennesker uden sygdom, der testes falsk-positive (mindske specificitet). For eksempel, computerstøttet-detektion (CAD) [4], digital billedbehandling [5], og kortere screening intervaller [6] al stigning mammografisk følsomhed for brystkræft, men formindske specificitet.

Når man sammenligner to diagnostiske tests , fortolkning er undertiden vanskeligt, hvis man har høj følsomhed og den anden høj specificitet. En kombineret mål for sensitivitet og specificitet letter fortolkning; eksempler indbefatter netto-fordel eller arealet under receiver-operator karakteristik (ROC AUC) [7] – [11]. En fordel ved netto-benefit foranstaltninger er, at de kan indarbejde relative værdier for gevinster i sand-positive diagnoser versus omkostningerne ved falsk negative diagnoser, mens ROC AUC ikke kan. Imidlertid har nogle undersøgelser kvantificeret disse omkostninger og dem, der har tyder de værdiansættes meget forskelligt af patienterne; En undersøgelse viste kvinder ville acceptere 500 falsk-positive mammografi for at undgå en enkelt savnet kræft [12]. Mens kvalitativ forskning tyder på, at deltagerne værdsætter følsomhed løbet specificitet ved screening for tarmkræft [13], [14] dette er ikke blevet kvantificeret. Hvis du ignorerer disse præferencer kan undervurdere test fordel. For eksempel, har Medicaid /Medicare beslutning om ikke refundere CT kolografi (CTC) ikke, at screenees stadig værdi gevinster i sensitivitet trods formindsket specificitet [15]. For at afklare dette spørgsmål, vi etablerede den relative vægtning givet af patienter og sundhedspersonale til yderligere sandt-positive diagnoser i forhold til yderligere falsk-positive diagnoser (dvs. gevinster i følsomhed versus tab af specificitet), når du bruger CTC for kolorektal cancer screening.

Metoder

Etik Statement

Etik godkendelse udvalg blev ydet af den lokale institutionelle etisk vurdering bestyrelse University College Hospitaler London; alle deltagere gav skriftligt informeret samtykke

Design

Vi har designet og udført et diskret valg eksperiment (DCE) [16] – [18]., ifølge de seneste retningslinjer [18]. Især kan patienter værdsætter følsomhed så stærkt, at selv små ændringer kan maskere indflydelsen fra andre attributter [18]. Også, specificitet er begrebsmæssigt udfordrende, med patienterne ofte uvidende om, at falsk-positive diagnoser kan forekomme [13]. Derfor, for at forenkle beslutningstagningen brugte vi en “sandsynlighed ækvivalens” design for at etablere holdninger til sensitivitet og specificitet alene, uden indflydelse af andre attributter. Vi præsenterede sensitivitet og specificitet i forhold til forskellige antal sande-positive og falsk-positive diagnoser ved billeddannelse. En hypotetisk “forbedret” CTC screeningstest blev præsenteret mod “standard” CTC og deltagerne bemærkede deres præference mellem de to. Følsomhed og specificitet for kræft for “standard” CTC var 85% og 95% og 80% og 85% for polypper ≥6 mm. “Enhanced” CTC hævet følsomhed til kræft til 95%, svarende til at opdage en ekstra kræft pr 5000 screenees (kræft prævalens 0,2%) [19], [20]. “Enhanced” CTC hævet følsomhed for polypper til 90%, svarende til at detektere 125 yderligere personer med polypper per 5000 (polyp prævalens 25%) [21]. Vi havde til formål at øge følsomheden med 10% og samtidig undgå en perfekt test, hvilket er urealistisk. Specificitet af “forbedret” CTC blev droppet i intervaller på 10% for kræft og 20% ​​for polypper (Tabel 1) på tværs af scenarierne. En sådan ekstremt lav specificitet er usandsynligt i det virkelige praksis, men nødvendigt at beregne “tipping points”, dvs. det niveau, hvor en person er villig til at “handel” én attribut for den anden. I det foreliggende tilfælde, vendepunkt var den maksimale nedsættelse specificitet, at deltagerne var rede til at handle for en 10% absolut (vs relativ) stigning i følsomheden.

Fordi DCE’ere er vanskelige at forstå, især via postale spørgeskemaer [22], vi brugte en interviewer-ledede design til patienter, der præciserer forståelse og tillader kvalitativ udforskning bagefter, især med ikke-handlende [23] (en “ikke-erhvervsdrivende” er en deltager, der ikke vil handle deres foretrukne attribut for enhver pris. med hensyn til den foreliggende undersøgelse vil dette normalt repræsenterer en person, der ville acceptere enhver værdi af formindsket specificitet for at nå 10% øget følsomhed). En multimedie laptop præsentation af kolorektal cancer screening af koloskopi og CTC blev givet, herunder oplysninger om overlevelse, at tidlig påvisning var ikke altid helbredende [24], og at falsk-positive CTC forårsagede unødig koloskopi. For klarhedens skyld blev kun de mest alvorlige coloskopisk komplikation præsenteret, perforering i 1:500 [25], [26]. Fordi inkonsekvent indramning kan indføre skævhed [27], både absolutte og relative risici blev vist tekstuelt og grafisk. Deltagerne blev bedt om at påtage sig de var gennemsnitlig risiko for cancer /polypper og at polypektomi ville reducere levetiden sygdomsspecifikke dødelighed med 25% [28].

Et tilfældigt scenario blev gentaget for at teste konsistens. Et scenario med en mulighed utvivlsomt overlegen for både sensitivitet og specificitet identificeret “irrationelle” responders. Endelig har vi indarbejdet “villighed til at betale” (WTP) vurdering: Standard CTC blev sat mod CTC med følsomhed hævet med 10%, men med identisk specificitet. Deltagerne blev spurgt om, hvor meget, hvis noget, ville de betale for dette.

Pilot

10 frivillige blev fløjet til at bekræfte forståelighed og informere stikprøvestørrelse [29]. Mens forståelse attributter og niveauer, har nogle ikke handle (dvs. de dømte den laveste specificitet acceptabel). Vi omprogrammeres derfor yderligere “stress-slides” (automatisk udløst af svarene accepterer den laveste specificitet for øget CTC), styrkelse potentielle skader, at vurdere, om heuristisk skævhed forankret deres beslutning. Tilsyneladende irrationelle reaktioner faldt på repeat lodsning af de samme frivillige. Også, var deltagerne blevet forvekslet ved at overveje kræft og polypper samtidigt, så den endelige undersøgelse præsenteret separat kræft og polypper DCE, sekventielt, hver bestående af 10 scenarier.

Rekruttering

Vi rekrutterede konsekutive samtykkende patienter screening alder ( 55 år), er planlagt til ikke-cancer ambulant ultralyd /plain-radiografiske undersøgelser på et universitetshospital, identificeret via bookingsystemer. Information /samtykkeerklæringer blev sendt og respondenter interviewet om deres udnævnelse dag. For at undgå bias vi udelukkede respondenter med en personlig historie, eller at blive undersøgt for, tarmkræft [30]. Alle deltagere blev tilbudt en £ 10 gavekort.

For at undersøge enhver holdningsmæssige forskelle mellem patienter og sundhedspersonale, vi rekrutterede radiologer, gastroenterologer, kirurger, sygeplejerske-specialister, og radiografer, der anmodede, udførte eller fortolkes kolorektal billedbehandling . For at lette rekrutteringen, kan sundhedspersonale fuldføre DCE online da vi betragtede de var fortrolige med de begreber præsenteret. Ellers en radiolog eller klinisk psykolog udført DCE, med scenarier, der præsenteres i tilfældig rækkefølge inden for de to DCE. Alle deltagere blev bedt om deres alder, etnicitet, uddannelse og husstandsindkomst beslag.

Analyse

Vores primære resultat var reduktionen i specificitet deltagerne var villige til at “handel” for 10% absolut (vs relativ) stigning i følsomhed. Vi definerede “tipping-point” som den højeste stigning i falsk-positiv rate (FPR; 1-specificitet) over basislinien, hvor deltagerne opfattede fordelene ved øget følsomhed blev opvejet af potentielle skader. I pilot var dette 45% for cancer (dvs. deltagere tilladt specificitet til at falde fra 95% til 50% i gennemsnit). For at bestemme medianen vendepunkt ± 5% ved tosidet alpha 0,05 og 90% strøm, der kræves 96 deltagere (

N

= 4σ

2

z

crit

2 /

D

2 hvor

D

= 0,10,

s

= 0,45,

z

crit = 1,960, σ = 0,25) [31]. Vi pre-specificeret sekundært resultat sammenligne patienter og fagfolk, for hvilke der kræves 88 deltagere til 90% magt til at opdage 15% forskel. Fordi vores pilot foreslog ikke-normalitet rekrutteret vi yderligere 15% [31]. De stress-slides blev udløst af deltagerne foretrækker “forstærket” CTC trods stigende FPR med 85% for kræft og 65% for polypper. Den højeste vendepunkt blev taget, hvis de handles efterfølgende; andre blev anset vedvarende ikke-handlende. Fordi deltagerne blev præsenteret samtidig med sensitivitet, specificitet, billedlige beskrivelser af ændringer og numerisk information om den absolutte stigning i falske positiver sammenlignet at stige i sande-positive (Figur 1), vi indrammet vores resultater i form af falsk-positive vs sandt- positive diagnoser, da dette er mest letforståelige

Hver tally mærke repræsenterer en af ​​5000 mulige resultater for en patient undergår screening:. ægte positive (blå), falsk negativ (gul), sande negative (hvid), eller falsk positiv (rød). Deltagerne blev informeret om, at hvis de skulle foretage den pågældende prøve, blev deres odds for at modtage nogen af ​​resultaterne repræsenteret ved chancen for at plukke nogen af ​​disse tally-mærker tilfældigt “ligesom roulette”. Data er også repræsenteret numerisk ved hjælp af både relative og absolutte procenter. Dette scenario svarer til ‘tipping point’ for patienter og professionelle respondenter:. I gennemsnit deltagerne begunstiget den forbedrede test (test B) på grund af dens ekstra følsomhed på op til, men ikke ud over, dette niveau af yderligere falske positiver

Den mediane vendepunkt blev beregnet for kræft og polypper, til fagfolk patienter /sundhedspersonale kombineret og hver for sig. Fordi patient og professionelle tal afveg vi brugte værdier fra 1999 bootstrap estimater af median og IQRs, hvor prøver indeholdt lige mange (n = 50) i hver gruppe, derfor vægtes patienter og fagfolk ens. På det vendepunkt, blev ændringen i specificitet svarer til en ændring i følsomhed 10% omdannet til en ændring i absolutte relative antal af falsk-positive og sand-positive diagnoser ved hjælp af ligningen for nettofordel [11], [32]:

nettofordel =

Hvor A sens = 10%, og Δspec = median vendepunkt, og W er den relative vægtning (det maksimale antal yderligere falsk-positiver handles per ekstra kræft eller polyp opdaget). Udbredelse blev tildelt 0,2% for kræft, 25% for polypper [19] – [21]

tipping points blev sammenlignet mellem patienter interviewet af hver enkelt forsker.. Tipping points var særdeles ikke-normal, så blev sammenfattet af medianer og interkvartile intervaller (IQR 25% til 50%); medianen kan fortolkes som svarende til en gennemsnitlig deltager. For tipping point og relative vægtning af falsk-positive til true-positive, blev alle ikke-handlende opfattes således, at højere FP værdier end tilbydes (Figur 2: grå værdier). Mann-Whitney U test statistik og Wilcoxon signed rank sum test blev anvendt til uparrede og parret sammenligning henholdsvis (Stata V11.0, Stata Corporation, College Station, Texas).

Hver gul prik viser en enkelte deltagers handel punkt. Grå symboler angiver værdier tildelt for deltagere, der nægtede at handle. Brun prik viser median værdi, der repræsenterer “en gennemsnitlig deltager”. Orange prikker viser 25 og 75 procentpoint. Grafer vises separat som følger: A; Patienter, kræft scenario (n = 72). B; Fagfolk, kræft scenarie (n = 50). C; Patienter, polyp scanario (n = 72). D; Fagfolk, polyp scanario (n = 50).

Resultater

112 konsekutive patienter og 62 fagfolk var inviteret. 75 patienter og 50 sundhedspersonale deltog, en respons på 67% og 81% (Tabel 2). Tre patienter kunne ikke fuldføre DCE forlader 122 til analyse (to læger gav partielle responser). DB interviewede 53 interviewede NB 48; 21 besvarelser var online. Sammenlignet med fagfolk, patienter var ældre, afbrudt uddannelse tidligere, og havde lavere husstandsindkomst (tabel 2)

Ikke-handlende

For påvisning af kræft 30 (25%. 27 patienter , 3 professionelle) deltagere var ikke-handlende, 20 (16%, 18 patienter, 2 professionelle) af der også var ikke-handlende til polypper. Ikke-handlende var signifikant mere tilbøjelige til at være patienter (27 [38%] vs 3 [6%]); p 0,001), var væsentligt ældre (median alder 64,5 vs 44,5; p 0,001), og var mindre uddannede end de handlende (15% versus 2% uden formelle kvalifikationer; p 0,001). Der var ingen signifikant forskel i køn (59% vs. 61% kvinder; p = 0,56) eller etnicitet (30% vs. 33% ikke-hvidt; p = 0,57). Overvejer patienter alene, ikke-handlende (n = 27) var ældre (median alder 66,8 vs 60,1; p = 0,001), mindre velhavende (median husstandsindkomst GBP10001-20000 vs. GBP20001- £ 30000 om året;. P = 0,03 GBP = Store britiske pund, = 1,2 euro og $ 1,6 på nuværende valutakurser) og mindre kvalificerede (median undervisningspligtige alder 16 vs. 18yrs; p = 0,02) end de handlende (n = 45). For kræft og polypper henholdsvis 34% (16/47) og 35% (11/31) deltagere, der oprindeligt var uvillige, efterfølgende handles efter stress-dias.

Cancer

Samlet set median vendepunkt for detektion cancer forekom ved 45% fald i specificitet (IQR 25 til 85%; tabel 3). Således i gennemsnit blev en 45% fald i specificitet behandlede maksimalt fald acceptabel i bytte for 10% øget følsomhed. Ved befolkning prævalens på 0,2%, svarer dette til 2250 (IQR 1250 til 4250) yderligere falsk-positive diagnoser pr ekstra sand-positiv cancer. Det gennemsnitlige antal yderligere falsk-positive pr ekstra sand-positiv detektion var signifikant højere for patienter (median 4250 (IQR 2750 til 4250) end fagfolk (median 1250, IQR 750-2250, p 0,001), dvs. den gennemsnitlige patient opfattede et større antal falske positiver acceptabelt at få en ekstra sand-positiv.

Polypper

Samlet set median vendepunkt for polyp afsløring var 15% (IQR 7,5 til 55;. tabel 3) således i gennemsnit en 15% fald i specificitet blev betragtet som den maksimalt fald acceptabelt i bytte for 10% øget følsomhed Ved befolkning prævalens på 25%, svarer dette til 6 (IQR 3 til 22) yderligere falsk. . -positive diagnoser pr ekstra sandt-positive polyp Igen median antal yderligere falsk-positive pr ekstra sandt-positive var signifikant højere for patienter (55, IQR 15 til 65) end professionelle (15, IQR 5 til 25. p 0,001)

for patienter og fagfolk kombineret, det gennemsnitlige antal yderligere falsk-positiver handles per ekstra sand-positiv detektion var signifikant højere for kræft end polypper (45 vs 15.; p. 0,001), hvilket indikerer, at større fald i specificitet blev opfattet acceptabelt, når der testes for kræft

Der var ingen signifikant forskel i den samlede median vendepunkt fremkaldt af radiologen eller psykolog, (p = 0,57) eller mellem medicinsk opnået professionelles data ansigt til ansigt vs online (p = 0,59).

Villighed til betaling

Tre fjerdedele af deltagerne var villige til at give en prisklasse de ville være villige til at betale for en test med følsomhed hævet med 10%, men uden tab af specificitet. Median WTP var signifikant højere for kræft end polypper: 201-500GBP (IQR 101-200GBP til 501-1000 GBP) vs. 101-200 GBP (IQR 51-100 til 201-500 GBP), s 0,001, hvilket indikerer deltagerne følte kræft detektion var mere end polyp detektion værd. Der var ingen signifikant forskel i WTP for polyp detektion når patienter og fagfolk blev sammenlignet (p = 0,97), men patienternes WTP var signifikant højere end professionelles til påvisning af kræft: median 201-500 GBP (IQR 101-200 GBP til 201-500GBP ) vs median 101-200 GBP (IQR 51-100 GBP til 201-500 GBP, p = 0,036). Desuden median husstandsindkomst var signifikant lavere for patienter end fagfolk (20001-25000GBP vs 40000GBP; p = 0,021, tabel 4), hvilket indikerer, at især var stærkt holdt patientens værdier fra en relativ perspektiv. De fleste deltagere (27 af 32 deltagere), som afviste at besvare WTP, afviste at svare for både polypper og kræft. Deltagere, der faldt gav i gennemsnit, højere værdier af falsk-positive pr ekstra sand-positiv diagnose.

Diskussion

I forhold til screening for tarmkræft og polypper, patienter og sundhedspleje fagfolk både værdsatte gevinster i diagnostisk sensitivitet over tilsvarende tab af specificitet. I gennemsnit blev der 2250 ekstra falsk-positiver anset værd handel for en enkelt ekstra sand-positiv diagnose af kræft og 6 yderligere falsk-positive for en ekstra sand-positiv diagnose af en polyp. Vores resultater svarer til dem fra en undersøgelse af mammografi, der findes kvinder, der er villige til at handle 500 falsk-positive mammografi (og deres konsekvenser) for at diagnosticere en enkelt ekstra kræft, der ellers ville have været savnet [12]. Selv om det er kendt, at patienter værdi følsomhed løbet specificitet for kolorektal cancer screening [33], [34], vi kunne finde nogen data, der kvantificeret dette for en radiologisk test. Vores interesse blev stimuleret af studier af CAD til CTC, som forøger følsomheden, men på bekostning af reduceret specificitet, undertiden betydeligt [35] – [38]. Men de potentielle kliniske konsekvenser af ubesvarede kræft (død) ikke svarer til dem for falsk-positiv diagnose (unødvendig koloskopi); vores resultater bekræfter, at både patienter og sundhedspersonale mener dette. Det er derfor vigtigt, at analysen af ​​forskningsundersøgelser af diagnostiske tests tage hensyn til denne asymmetri. Diagnostiske tests kan sammenlignes ved hjælp af netto-benefit foranstaltninger, der inkorporerer relative vægtning for forskellige kliniske omkostninger [11], [39]. Derimod statistiske foranstaltninger såsom ROC AUC ikke kan tildele forskellige værktøjer til gevinster i følsomhed versus falder i specificitet og så kunne finde en ny test uden værdi, når både patienter og fagfolk måske tror ellers.

Vi brugte en diskret valg eksperiment, en forholdsvis ny metode til oprettelse af præferencer [40]. Traditionelt er præferencer fremkaldt via ranking [41], med test attributter isoleret betragtet. Resultaterne er derfor forudsigelige: Patienter og favorisere tests, der er følsomme, specifikke, billig og ikke-invasiv. Det betyder dog ikke afspejler de afvejninger, der efterspørges af virkelige praksis. DCE, er i stigende grad anbefalet af forskere, fordi respondenterne angiver præferencer mellem forskellige test egenskaber, som mere præcist afspejler den virkelige verden valg [16] – [18], [41] – [43]. Fordi DCE’ere er komplekse, leverede vi de fleste eksperimenter ansigt til ansigt for at lette forståelsen og deltagelse, hvilket kan øge generaliserbarhed af resultater. Derfor fleste deltagere gav fuldstændig, ensartet, meningsfulde svar. Mens interviewer bias er muligt, fandt vi ingen signifikant forskel mellem alle modtagne svar fra psykolog eller radiolog. Endvidere var der ingen signifikant forskel i respons opnået ansigt til ansigt eller online.

For at forenkle og fokusere den kognitive opgave, vi sammenlignet blot to attributter, stigning i sand-positive og falsk-positive diagnoser ved billedbehandling (også udtrykt af sensitivitet og specificitet). For at skabe en “forbedret” test, som oppustet følsomhed for kræft til 95% (perfekt følsomhed ville være urealistisk) brugte vi en baseline følsomhed på 85% for standard CTC, som sandsynligvis en undervurdering. Men i denne type eksperiment, den relative vægtning af attributter på tværs af forskellige scenarier er nøglen, ikke den absolutte forskel mellem dem. Ved hjælp af denne konstruktion vi fremkaldt den relative betydning, at deltagerne placeret på gevinster i følsomhed versus tab af specificitet.

Selvom begge grupper værdsatte gevinster i følsomhed over tilsvarende tab af specificitet, dette fund var stærkere for patienterne. Sundhedspersonale, især dem, der er lægeligt kvalificerede, vil have en dybere forståelse af de fordele og ulemper ved diagnosticering som tidligere nævnt, behøver nogle patienter ikke forstå, at falsk-positiv diagnose er mulig [13]. Patienterne var ældre, afbrudt uddannelse tidligere, og havde cirka halvdelen af ​​den årlige husstandsindkomst på sundhedspersonale, men patienterne tilskrives en pengeværdi til øget følsomhed, var ca. det dobbelte af fagfolk, demonstrerer de anser følsomhed usædvanligt vigtigt.

Hvis statistiske analyser skal redegøre for afvigende vægtning til sensitivitet og følsomhed, en særlig interessant spørgsmål er, hvis vægtning skal anvendes? Nogle vil hævde, at sundhedspersonalet er den bedste løsning, især medicinsk kvalificerede klinikere fordi de anmoder om tests, har den dybeste forståelse for fordele og ulemper, og dermed har den bredeste og mest informeret perspektiv samlet. Andre vil hævde, at samfundet i sidste ende gennemgår og betaler for diagnosticering, og så patienternes perspektiver er mest hensigtsmæssige. Denne udstedelse af tegningsoptioner yderligere forskning.

Vores undersøgelse har begrænsninger. Som tidligere bemærket, DCE, er udfordrende for deltagerne [44], der kræver motivation, færdigheder og regnefærdigheder, som kan indføre selektionsbias [23]. Vi har forsøgt at reducere denne effekt ved at bruge en interviewer snarere end en post spørgeskema. Selv om vi havde strøm til vores primære endpoint, større og /eller forskellige prøver vil bedre undersøge forskelle mellem underkategorier af patienter og sundhedspersonale. Fordi vi troede, at vi ikke bør ignorere særlig stærkt afholdt tro, vi medtaget ikke-handlende via beregning medianværdier; vores estimater er derfor en undervurdering. WTP estimater er også sandsynlige undervurdering på grund af modvilje mod at statens indtægter. Vi fulgte retningslinjer for bedste praksis af DCE undersøgelser [18], men antyder, at strategier for design og analyse brug for yderligere undersøgelse [45], [46]. Fælles for alle hypotetiske scenarier, kan forsøgspersonernes handlinger i det virkelige liv ikke spejle dem, der udtrykkes i en DCE. Endelig de justeringskoefficienter vi afledte er specifikke for kolorektal cancer screening. Vi mener imidlertid, at de sandsynligvis vil være magen til andre scenarier, der involverer diagnosticering af kræft [12].

Sammenfattende via diskrete valg eksperiment fandt vi, at både patienter og sundhedspersonale tror gevinster i diagnostisk sensitivitet er værd mere end de opfattede negative konsekvenser af et tilsvarende tab af specificitet, når de overvejer kolorektal cancer screening. Gevinster i følsomhed i tab af specificitet blev vurderet mere stærkt for påvisning af kræft (vs polypper) og af patienter, snarere end sundhedspersonale. Disse virkninger bør påvirke bedømmelsen af ​​nye screeningstest.

Be the first to comment

Leave a Reply