PLoS ONE: Mønstre for Information-Søger for Cancer på internettet: en analyse af Real World Data

Abstrakt

Selvom traditionelt de primære informationskilder til kræftpatienter har været de behandlende medicinsk team, patienter og pårørende i stigende grad henvender sig til internettet, selvom denne kilde kan være misvisende og forvirrende. Vi vurderer Internet søge mønstre til at forstå informationsbehovet hos kræftpatienter og deres bekendte, samt at skelne deres underliggende psykologiske tilstande. Vi screenede 232,681 anonyme brugere der indledt cancer-specifikke forespørgsler på Yahoo Web søgemaskine over tre måneder, og i undersøgelsen brugere med høje niveauer af interesse i dette emne. Søgninger blev delt af forventede overlevelse for den sygdom, der søges. Vi sammenlignede søgemønstre af anonyme brugere og deres kontakter. Brugere søger oplysninger om aggressive maligniteter udstillet kortere søgning perioder med fokus på sygdoms- og behandlingsrelaterede relaterede oplysninger. Brugere, der søger viden om mere indolente tumorer søgt efter længere perioder, vekslede mellem forskellige fag, og viste en stor interesse i emner som støttegrupper. Bekendte søgte i længere perioder end probanden bruger, når de søger oplysninger om aggressive (sammenlignet med indolent) kræftformer. Informationsbehov kan modelleres som skiftes mellem fem diskrete tilstande, hver med en unik signatur, der repræsenterer den type oplysninger af interesse for brugeren. Således tidlige faser af oplysninger-søger for kræft følge en bestemt dynamisk mønster. Områder af interesse er sygdom afhængige og varierer mellem probander og deres kontakter. Disse mønstre kan bruges af læger og medicinsk webstedet forfattere til at skræddersy information til de behov, som patienter og familiemedlemmer

Henvisning:. Ofran Y, Paltiel O, Pelleg D, Rowe JM, Yom-Tov E (2012 ) Mønstre af Information-Søger for Cancer på internettet: En analyse af Real World data. PLoS ONE 7 (9): e45921. doi: 10,1371 /journal.pone.0045921

Redaktør: Petter Holme, Umeå Universitet, Sverige

Modtaget: 8. maj 2012; Accepteret: August 27, 2012; Udgivet: 21 september, 2012 |

Copyright: © Ofran et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Alt arbejde blev udført som en del af de respektive forfattere forskning, uden yderligere eller ekstern finansiering

Konkurrerende interesser:. DP og Turiståret er medarbejdere i Yahoo Inc. Yahoo ikke og vil ikke få økonomisk fra dette arbejde. Dette ændrer ikke forfatternes tilslutning til alle PLoS ONE politikker om datadeling og materialer. Forfatterne bekræfter, at der ikke er nogen patenter, produkter i udvikling eller markedsførte produkter at erklære stammer fra dette arbejde.

Introduktion

Tredive år siden, Dr. Franz Ingelfinger, en gastroenterolog og tidligere redaktør af

New England Journal of Medicine

, blev diagnosticeret med spiserøret adenocarcinom. I et foredrag leveret efter hans diagnose [1], beskrev Dr. Ingelfinger nød forårsaget af oversvømmelsen af ​​information rettet mod ham og hans familie. Han roste en af ​​hans venner til at rådgive ham til, “glemme de oplysninger, du fik fra mange sider og kigge efter en person, der ville blot fortælle dig hvad du skal gøre”. “Du har brug for en læge”, sagde han [1]. Tilbage i slutningen af ​​halvfjerdserne, lægerne var den vigtigste (og for mange patienter den eneste) kilde til information. I dag behøver patienterne ikke være redaktører af en medicinsk tidsskrift for at imødegå torrents oplysninger fosser fra internettet. Denne spærreild af “fakta” udfordrer lægers rolle og autoritet. I tilfælde af kræft diagnose, de fleste patienter søge på internettet efter oplysninger kræft, sædvanligvis forud for deres første møde med et onkologisk specialist [2]. Deres informationsbehov synes at afvige med kræft typen [3]. Internet baseret information blev rapporteret af patienter til at være en udløsende faktor for deres beslutninger om terapi, kliniske forsøg og selv vælge deres læger. Men undersøgelser har vist, at patienter har en tendens til ikke at dele uformelle oplysninger med deres læger [4] – [6]. Derfor en god forståelse af, hvordan patienterne håndtere erhvervelse oplysninger via internettet er afgørende for en effektiv patient-læge kommunikation, som vil være relevante for patienternes behov.

Undersøgelse den måde patienterne søge information på internettet er vanskelig. De fleste søgninger udføres i privatliv væk fra medicinske faciliteter eller sundhedspersonale. Derfor kan to måder bruges til at studere det: Først gennem retrospektive spørgeskemaer eller via indhold, skabt, mens du søger efter disse oplysninger på nettet. Selvrapporterede spørgeskemaer eller interviews [7], [8] har nogle store ulemper. Det første er der en iboende selektionsbias vedrørende patienter, som indvilliger i at deltage i undersøgelsen, med en tendens til også at omfatte personer med særlige sociodemografiske karakteristika såsom højere indkomst og uddannelsesniveau [9]. Andet, selv en lav ikke-svarprocent kunne skævhed undersøgelse konklusioner [10]. For det tredje, undersøgelser normalt fokusere på patienter, men i mange tilfælde informationsindsamling via internettet er udført af patientens familiemedlemmer [11], [12]. Sidste, oplysninger indsamlet i løbet af de første par dage af sygdom betragtes grundlæggende for en patients opfattelse af sygdommen [13] – [15]. Men det er meget vanskeligt at foretage undersøgelser, der dækker denne korte og stressende periode [16], og retrospektive selvstændige rapporter har vist sig at være unøjagtige [17].

Søgemaskiner og andre websteder, registrere data produceret gennem målrettet aktivitet (fx skrive blogs eller sende forespørgsler) og indirekte aktivitet (fx surfe på internettet). Kendt som brugergenereret indhold (UGC), er disse blevet anvendt til at overvåge udbredelsen af ​​influenza [18], undersøge nytten af ​​lithiumcarbonat i amyotrofisk lateral sklerose [19], og overvåge sæsonmæssige og geografiske ændringer i depression forekomst [20] blandt andre epidemiologiske spørgsmål [21] – [23]. I vores arbejde, vi undersøgte anonym storstilet UGC, leveret af Yahoo søgemaskinen til at undersøge kræft-relaterede oplysninger-søger mønstre.

Metoder

Dataindsamling og kategorisering

Alle forespørgsler indsendt af brugere af Yahoo Web søgemaskine i USA mellem maj og juli 2010 er analyseret. Data anvendt til udførelse af denne undersøgelse er privilegerede oplysninger indsamlet af Yahoo Inc., og indsamlet af DP og Turiståret, som er medarbejdere i Yahoo Inc. Oplysningerne på hver forespørgsel inkluderet forespørgslen tekst, dens tid og dato, en liste over sider besøgt af brugeren som følge af forespørgslen, og en anonymiseret brugeridentifikation.

forespørgsler blev filtreret til kun at omfatte cancerspecifikke forespørgsler, defineret som dem, der omfattede navnet på mindst én af de 35 mest almindelige specifik kræftformer opført af SEER [24], og divideret med deres 5-års overlevelsesraten i to forskellige grupper: aggressiv (5-års overlevelse under den generelle medianen for kræftpatienter) og indolent (5-års overlevelse over den generelle medianen for kræftpatienter ).

Etik erklæring

Alle forskningen blev udført i overensstemmelse med de Yahoo retningslinjer på menneskers emne forskning, efter forudgående godkendelse fra Yahoo interne menneskelige Emne Research rådgivende udvalg heri beskrevet. Specifikt for denne opgave, blev data først anonymiseres og blandes før analyse, og ingen enkelt-niveau bruger datum blev undersøgt. Disse data kan være tilgængelige for forskere efter underskrivelsen af ​​de nødvendige juridiske aftaler at opretholde brugernes privatliv.

Identifikation brugere med høj interesse i bestemte kræftformer

Blandt de 232,681 screenet brugere, der søgte efter kræft relaterede information, de fleste søgende set kun sparsomme sider. Disse brugere var mere tilbøjelige at bruge Yahoo søgemaskine som en portal for at komme til en bestemt web-side og blev udelukket fra vores undersøgelse. Fordelingen af ​​antallet af viste sider af hver bruger er meget skævt. Faktisk er det tæt tilnærmes ved en power-lov fordeling, med skråninger -2,19 (R

2 = 0,97), som beskriver en fordeling mønster hvorved de fleste brugere se kun et par sider og en mindretalsudtalelse mange sider. Derfor er en vilkårlig grænse på fem sider besøgte mens udstationering kræftrelaterede spørgsmål i undersøgelsesperioden blev valgt, til at identificere brugere med den stærkeste interesse i bestemte kræftformer. I tilfælde af, at brugerne søgte efter mere end én cancer type, blev den dominerende sygdom pr søgepersonens defineret som den specifikke cancertype, at de søgte efter med den højeste frekvens. Ved hjælp af ovennævnte kriterier, blev 182,564 brugere udelukket, og i alt 50,117 brugere, der bogført 225,675 forespørgsler blev inkluderet i undersøgelsen.

Identifikation og kategorisering af populære web-sider

Antallet af brugere, der kiggede på hver side har en lignende effekt praksis fordeling, med skråninger -2,25 (R

2 = 0,98). At udforske indholdet af de mest populære sider, vi kun fokuseret på sider besøgt af mindst fem brugere og manuelt inspiceret en tilfældig stikprøve på 500 sider. Ti kategorier blev identificeret, muliggør klassificering sider efter deres temaer. For at mærke alle sider besøgt af alle brugere, blev crowdsourcing anvendt, specifikt Amazon Mechanical Turk tjeneste (https://www.mturk.com/), der tillader hver side der skal vises til evaluatorer, der bliver betalt for at kategorisere websider [25]. Tidligere arbejde har vist, at denne kategorisering udføres med nøjagtighed kan sammenlignes med eksperter [26]. Hver side blev sendt til 5 uafhængige personer til mærkning i en af ​​de 10 kategorier.

Alle 5987 besøgte sider blev introduceret til 776 Mekanisk Turk labelers, som hver især er mærket i gennemsnit, 34 sider (± 181 sider ). Af disse 3602 sider havde en særskilt etiket enige om med mindst 3 labelers. Antallet af sider i hver kategori er vist i tabel 1. De resterende 2385 sider ikke havde veldefinerede etiketter, og blev fordelt som følger: I 46% af de sider, to kategorier modtog to stemmer hver, og i 48% en kategori modtaget to stemmer og tre modtog én stemme hver. At udforske mulige årsager til uenighed mellem labelers, siderne var i-silico kvantificeret ved at analysere de ord, de indeholdt. Vi anvendte et vektorrum model [27] til at repræsentere de ord på hver side, og måles afstanden til det geometriske tyngdepunkt (dvs. den gennemsnitlige vektor model) for hver kategori. Afstanden af ​​alle ikke-klassificerede sider til de kategorier, der er angivet med labelers var næsten det samme (i gennemsnit inden for 5%). Men for sider, hvor der var et flertal mellem labelers, denne forskel var i gennemsnit 20% (rank sum test, p 10

-10). Vores konklusion er, at sider med ikke-diskret mærkning er virkelig tvetydig med hensyn til mærkning, og er således ikke omfattet af vores analyse.

Genkendelse søgemønstre

Brugernes søgemønstre blev defineret som den rækkefølge, de gennemse sider fra forskellige kategorier, samt den tid det tager at gøre dette. Behovet for information antages at være dynamisk, skiftende som en funktion af fysiske og psykiske forandringer [28]. Ændring mønstre af den type ønskede oplysninger kan afspejle overgangen mellem mentale tilstande fælles for personer, der deler kliniske og psykologiske tilstande. Disse observerbare stater er skjult, men kan identificeres fra søgemønstre bruger Hidden Markov Models (HMM’er) [29], der vurderer de skjulte tilstande af et system, sandsynligheden for overgangen mellem dem, og sandsynligheden for hver observerbare signal givet skjult tilstand. For at finde den mest sandsynlige antal skjulte tilstande brugere gik igennem i den tid, vi observerede dem, vi først trænet HMM’er af et varierende antal skjulte tilstande, og 10 synlige sider kategorier. Den bedste antal skjulte tilstande blev fundet ved hjælp holdout, som følger: Vi trænede HMM hjælp læser data fra 75% af brugerne, og testede model nøjagtighed ved at sammenligne de forudsagte sekvenser af søgninger for de resterende 25% af brugerne med deres faktiske adfærd. Denne procedure blev gentaget 5 gange med et tilfældigt udvalg af den oprindelige model med at mindske risikoen for konvergens til et lokalt minimum.

probanden bekendte

Endelig for at studere forholdet mellem ransagninger af sociale bekendtskaber, vi brugte på listen over kontakter i Yahoo Instant Messenger (YIM) program som en proxy for brugernes sociale netværk. Antallet af kontakter per person er magt-lov fordelt (α = -0,99, R

2 = 0,93), med en median på 6.

Statistisk analyse

Vi sammenlignede mønstrene søgning under anvendelse af ikke-parametriske tests, på grund af de ikke-gauss fordelinger af disse mønstre. P-værdier mindre end 0,05 blev betragtet som statistisk signifikant.

Resultater

Hvor sandsynligt er vores asylansøgere til at være rigtig kræftpatienter?

Vi brugte en lineær regressionsmodel til at sammenligne frekvensen af hver enkelt kræftform i forespørgslen log med dens kendte alder justeret forekomst, alder-justeret 5-års relativ overlevelse, og den mediane alder af diagnose. Alder justeret forekomst var stærkt korreleret med forespørgsel log prævalens, forklarer over 65% af variansen. (P 10

-5), og var den eneste statistisk signifikant korrelat af forekomsten forespørgsel log (figur 1)

forekomsten af ​​kræft er stærkt korreleret med den frekvens, hvor forespørgsler relateret til dem er lagt ud på internettet.

Dette arbejde har til formål at karakterisere de behov og søgemønstre af patienter og deres familier, venner og andre nære bekendte, der bruger internettet som en vigtig kilde til information. Brugere, der udvalgte sider i kun én kategori sandsynligvis enten ikke patienter og deres primære omsorgspersoner (fx studerende) ellers brugere, der foretrækker andre informationskilder end på nettet og bruger internettet lejlighedsvist eller kun når de søger specifikke oplysninger. I vores kohorte af brugere identificerede vi to grupper af brugere: den ene, bestående af 20,808 (41,5%) personer, der besøgte sider fra to eller flere kategorier (for kategorier definitioner se nedenfor) udviser interesse for flere aspekter af en kræftsygdom. De resterende 29,369 (58,5%) brugere besøgte kun sider fra en enkelt kategori. Brugere, der udviser et snævert udvalg af interesser i web-afledte oplysninger kræft er ikke inden for fokus i dette arbejde, og blev derfor udelukket fra vores analyse.

Brugere af den første gruppe søgt efter oplysninger for en gennemsnitlig periode på 10,0 dage (± 14,5 dage) i perioden data. Derfor er det klart, at en bestemt begivenhed kan have udløst deres søgning. Vi spekulere, at disse brugere er enten nyligt diagnosticeret kræftpatienter eller dem meget lukke dem, der tjener som deres “Internet agenter”. Vi yde supplerende støtte til dette nedenfor.

Information-søger mønstre kan udgøre underliggende psykologiske tilstande og er sygdomsrelateret

Den mest sandsynlige antal skjulte tilstande er vist i figur 2. Den bedste forudsigelse af søgemønstre er nået med fem skjulte tilstande, som vi spekulere er et produkt af overgange mellem fem mentale tilstande i løbet af undersøgelsen periode. Mønstret af søgninger var relateret til aggressiviteten af ​​cancer. Figur 3 viser, tilstandsdiagrammet til aggressive sygdomme er lidt mere streng-lignende, med de første to tilstande er den mest stabile, dvs. brugere er mest sandsynligt at forblive i disse stater. Omvendt tilstandsdiagrammet for de mere indolente sygdomme er meget forbundet med hinanden, overgange mellem stater er mere symmetrisk, og de mest stabile stater er de tre sidste. Sammenlignes HMM’er lært for indolent versus aggressive sygdomme, finder vi, at output-tilstande er rangeret forskelligt, og at der for sidstnævnte behandling information er vigtigere senere i søgeprocessen. Interessant, støtte vises kun som et væsentligt output tilstand for indolente kræftformer.

Denne graf viser den gennemsnitlige fejl at forudsige siden kategori, som en 25% delmængde af populationen af ​​brugere vil browse på grund af deres fortid browsing adfærd og modellen for bruger søger konstrueret ved anvendelse en anden delmængde (de resterende 75%) af befolkningen. Den laveste fejl er nået for 5 skjulte tilstande, hvilket tyder på, at brugerne går gennem fem faser af søgning under deres søgning proces.

De statslige overgange for kræft med nedenfor-median overlevelse er mere streng-lignende, med de første to stater er de mest stabile tilstande. Omvendt staten diagrammer for de mere indolente sygdomme er meget forbundet med hinanden, overgange mellem stater er mere symmetrisk, og de mest stabile stater er de sidste tre stater. Tabellen viser alle Kategorier (observerbare stater) med en sandsynlighed på mere end 0,05 for hver af de skjulte HMM stater, bestilt af faldende sandsynlighed. Mens output stater er ens for begge grupper af sygdomme, er de rangeret forskelligt. Desuden søgende for kræft med nedenfor-median overlevelse søge efter oplysninger behandling senere i søgeprocessen. Interessant, støtte vises kun som et væsentligt output tilstand for indolente kræftformer.

Brugere søger efter aggressive kræftformer har en organiseret søgemønster med stor interesse i information og behandling af sygdomme i begyndelsen og en lav rente i støttende og sociale organisationer. Brugere interesseret i mere indolente kræftformer følge en mindre direkte bane, bevæger sig frem og tilbage mellem forskellige kategorier og udtrykker stor interesse i støttegrupper.

Søgninger fra bekendte

Listen over kontakter for hver bruger fra Yahoo Instant Messenger (YIM) var til rådighed til at identificere hver brugers liste over kontakter, og at analysere deres forhold mellem kræft-relaterede søgninger. I undersøgelsesperioden, 279 brugere søgte efter oplysninger kræft i mindst to kategorier mens mindst en af ​​deres kontakter i YIM gjorde det så godt. Vi kunne ikke finde en tilstrækkelig høj grad af kræft-relaterede søgeaktiviteter for bekendte af de resterende brugere, og dermed fokusere på søgeadfærd af denne relativt lille gruppe af brugere. Vi bemærker, at antallet af observerede par af samtidigt søger brugerne er cirka 6 gange større end den, der forventes ved en tilfældighed. Således er disse co-forekommende søgninger i netværket er meget betydelige. Den type kræft forespørges i mindst én af de søgninger overlappede mellem proband brugere og bekendte i 56% af tilfældene. Dette er sammenlignet med 25%, hvis brugere tilfældigt matches.

Bekendte af brugere, der søger oplysninger om mere indolente sygdomme begyndte at søge i gennemsnit 15 dage efter den første søgende. For aggressive sygdomme, denne periode var kun 9 dage (p = 0,06, rang sum) (Figur 4). Bekendte søgt efter en meget kortere periode end den første bruger i tilfælde af indolent sygdom (5,1 ± 8,1 dage versus 13,9 ± 18,9 dage, p = 0,01, underskrive test). I modsætning hertil i tilfælde af aggressive sygdomstilstande bekendte søgte efter lidt længere end den første bruger (12,5 ± 17,3 versus 11,0 ± 14,7 dage, ikke statistisk signifikant). Den første Søgepersonens i et par bekendte søger oplysninger om kræft søgt i gennemsnit 28% flere sygdomme (tegn rang, p = 0,03). Vi hypotesen dette kan repræsentere ikke-specifikke søgninger forud for den endelige diagnose.

a. Når patienter er diagnosticeret med kræft, de indhente oplysninger fra læger, internettet og deres venner og familie. Ved at karakterisere patienter oplysninger-søger mønster kan vi bedre forstå patienternes behov. B. Mønstre af søgning på internettet afspejler underliggende psykologiske tilstande. Mest sandsynligt udgangstilstande identificeret ved HMM’er er ens for begge indolente og aggressive sygdomme og er repræsenteret ved de farvede kvadrater. Men søgende om oplysninger om aggressive kræftformer søge behandling oplysninger senere i søgeprocessen, mens støtten kun vises som en væsentlig output tilstand for indolente kræftformer. C. Time-linje af kræft-relaterede søgning ved probanden søgende (sandsynligvis patienten eller hans primære omsorgsperson) og andre bekendte. Bekendte er meget aktive søgende til aggressive sygdomme, men meget mindre så for indolente sygdomme, med en kortere søgning periode, som ikke overlapper med den for de første søgende.

Endelig første søgende i hvert par af søgende er mere tilbøjelige til at undersøge sider med relation til kræftbehandling (25% mere, p = 0,01, rang sum test) sammenlignet med anden søgere) og information om cancer (14% mere, ikke statistisk signifikant). De senere-søger bekendtskaber var mere tilbøjelige til at gennemse sider med oplysninger om årsagerne til kræft (116% mere (ikke statistisk signifikant), i forhold til proband søgende) og sociale medier relateret til kræft (75% mere (ikke statistisk signifikant)).

diskussion

perioden 100 dage efter kræftdiagnose er anerkendt som “den eksistentielle situation i kræft” [30]. I deres papir, Weisman og Worden [30] beskrev, hvordan grundlæggende disse første dage er til at håndtere kræft relaterede nød i fremtiden. Information opnået i denne periode former og definerer patienternes perspektiv om deres tilstand.

Internettet revolutioneret den måde patienterne og deres bekendte indsamle oplysninger. Kræft eksperter ofte støder patienter, der blev tegnet af internettet til fejlagtige selv-diagnose, udokumenterede behandlinger [31], [32], eller som er nødstedte ved udsættelse for ekstreme udfald muligheder efter internetsøgninger. I denne undersøgelse har vi fokuseret på de behov for information formodede kræftpatienter og deres bekendte.

Vores undersøgelse viser, at informationsbehov intensive søgende er forskellige, afhængig af sværhedsgraden af ​​kræft, og hurtigt ændre sig over en periode dage (figur 4). Vi formoder, at den indledende intensive søgepersonens er patienten eller tæt omsorgsperson (fx forældre, ægtefælle). Kun senere andre bekendte som venner eller andre familiemedlemmer deltage i søgningen. I aggressive kræftformer, søgetiden af ​​patienten er kortere, enten på grund af behovet for akut behandling, eller fordi patienter foretrækker at undertrykke tal, statistik og fakta på disse sygdomme. Onkologer, der giver pålidelige oplysninger, reservedele patienter ineffektive og engang vildledende webbrowsing [32]. Den overraskende lav andel af internetbrug rapporteret i forældre til børn med kræft og blandt patienter med fremskredne stadie kræft [33] – [35] kan afspejle et lignende fænomen. Vores data kan derfor afspejle tidligere henvisning til kræft eksperter til patienter med aggressive sygdomme.

Patienter med aggressive kræftformer tilbragte et kort tid på at søge efter oplysninger af sig selv, men deres bekendte var involveret tidligt og søgt efter relativt længere perioder. Omvendt for indolente kræftformer, bekendte var involveret sent i søgeprocessen og brugte kun en kort periode at søge på internettet. Resultaterne tyder på, at patienter og primære plejepersonale af patienter med mindre aggressive tumorer har mere tid til at bruge på internettet søger end dem med aggressive tumorer. Forsinkelsen bekendte søgninger kan skyldes patienternes tilbageholde information forud for den endelige diagnose. En kortere forsinkelse kan repræsentere en kortere hul i aggressive kræftformer mellem tidlig mistanke og endelige diagnose eller behandling beslutninger.

Tilbage i 1976 selvstændigt at indsamle oplysninger om dem ‘sygdom var besværlig og var således meget afhængig af oplysninger fra læger . I dag, ved hjælp af internettet, betydelige mængder af information kan samles i meget kort tid. Faktisk viste vores konstatering af, at typen og intensiteten af ​​at søge varieres inden dag, tyder på, at i internet æra “den eksistentielle situation i kræft” varer meget mindre end 100 dage, og kan variere blandt patienter med forskellige kræftformer.

Læger se patienter under en meget følelsesmæssigt dynamisk og kritiske periode. Patienternes mentale tilstand påvirker informationssøgning proces, og det erhvervede oplysninger kan til gengæld ændre patienternes psykiske tilstand. De fleste mennesker begynder internetsøgning forud for mødet med onkolog [2]. Derfor er længden af ​​forsinkelse mellem diagnose og henvisning til specialister, samt intensiteten af ​​sygdommen og det haster med behandlingen er alle kan påvirke de oplysninger indsamle mønster.

Som vi viste i vores resultater, søgemønstre er afhængige af sværhedsgraden af ​​sygdommen, som er længden af ​​hele søgeprocessen og overgangen mellem HMM stater. Påfaldende, i en model af den søgende mønstre antallet af skjulte tilstande svarer til det antal mentale tilstande forudsagt af Kübler-Ross model [36]. Imidlertid er der behov for yderligere forskning for at demonstrere, om og hvordan de skjulte HMM stater matcher de forudsagt af Kübler-Ross model (dvs. benægtelse, vrede, overenskomstforhandlinger, depression og accept), og samspillet mellem disse interne mentale tilstande og eksterne begivenheder .

Undersøgelser, som er baseret på UGC, især dem i sundhed domæne, er ofte den eneste saglig kilde til oplysninger om, hvordan brugerne søger information. Som vi fremhævede i denne undersøgelse, disse er afgørende for læger til bedre at forstå deres patienter, og til gengæld for en bedre informationsudveksling mellem patienter og plejepersonale. Imidlertid bør behovet for disse undersøgelser ikke på kompromis privatlivets fred for brugerne. I denne undersøgelse har vi taget konkrete skridt til at minimere denne risiko ved at anonymisere brugeridentitet og ved at analysere data, efter aggregere det fra flere brugere. vi tror derfor vi har fået mange af fordelene ved at studere UGC, uden at kompromittere brugerens privatliv.

Forholdet mellem anonyme asylansøgere og

real

kræftpatienter er en potentiel faldgrube i dette arbejde. At fokusere på brugere størst sandsynlighed vil have en tæt relation med en kræftpatient, blev internetbrugere, som ikke udtrykker et bredt spektrum af interesse i en bestemt type kræft udelukket. Det er rimeligt at antage, at antallet af sådanne brugere, der gav udtryk for en bred interesse for en enkelt sygdom for en anden grund end en konkret patient er lav. Det skal bemærkes, at patienter, der ikke søger oplysninger på nettet pegede på en nær slægtning som en, der surfet på nettet for dem [32]. Derfor udforske sædvanlige søgning mønster af enten patienter eller deres nære slægtninge er vigtig. Vores undersøgelse kan have udelukket nogle brugere, der faktisk var virkelige patienter, hvis de udviste interesse i kun ét aspekt af sygdommen, selv om de måske har været repræsenteret ved proxy asylansøgere. Vi bemærker dog den stærke sammenhæng mellem sygdom prævalens og hyppigheden af ​​søgning i søgemaskinen, som yderligere dokumentation til brugerne bliver faktiske kræftpatienter og deres nære bekendte.

Vores undersøgelse har flere begrænsninger. Naiv internetbrugere er tilbøjelige til selv-fejldiagnose via et fænomen kaldet cyberchondria [31], når mindre symptomer (f.eks, hovedpine) tolkes at være symptomer på alvorlige sygdomme (fx hjerne kræft). For at minimere bias relateret til forespørgsler genereret af mennesker, som ikke kræftpatienter, kun en udvalgt gruppe af brugere (42% 20.808 /50.117, udvalgt som beskrevet i afsnittet Metoder) blev analyseret. Det faktum, at søgemønstre afvige forventet overlevelse, øger sandsynligheden for, at vi sandsynligvis gøre med virkelige patienter og deres bekendte. Den Yahoo søgemaskinen var vores eneste kilde til information, men kun en lille delmængde (anslået til 4%) [37] af befolkningen er kendt for at bruge flere søgemaskiner parallelt. Brugerne kan også finde oplysninger på internettet via andre end søgemaskiner betyder. dataene angiver dog, at de fleste brugere vælger søgemaskiner som den primære kilde til information for sundhedsrelateret information i almindelighed og for cancer-relaterede oplysninger, herunder: Det er blevet anslået, at 66% af brugerne begynder deres søgen efter sundhed -relaterede oplysninger om søgemaskiner [38]. Desuden er en nylig undersøgelse viste, at 71% af de patienter, der har søgt efter information kræft primært bruge en søgemaskine som et oplagt middel i forhold til kun 13%, der foretrak at gå direkte til specifikke kræftrelaterede hjemmesider [2]. Information søger hjælp andre medier udgør en kilde til information, som mangler i vores analyse. vores fokus på brugere, der har indgivet et stort antal kræftrelaterede forespørgsler betyder dog, at vores data stammer fra en befolkning, der bruger søgemaskiner som en vigtig kilde til information. Den Mechanical Turk Systemet kan også være forudindtaget. Fordeling af arbejde til et stort antal labelers, der hver især er mærket i gennemsnit kun 34 sider, minimerede potentielle fordomme. Dataene blev indsamlet i en begrænset periode, og dermed er det ukendt, hvis er populationen inkluderet bestod en indledende kohorte. Men vores resultater om længden af ​​typiske søgning perioder (10 dage, sammenlignet med 90 dages data) antyder, at den befolkning, som begyndte at søge, før dataindsamlingen begyndte er relativt lille. Endvidere HMM algoritmen bringer data og antager, at kan mangle i begyndelsen af ​​søgningen sekvens. Virkningen af ​​den ikke-starten kohorte på vores resultater er således lille. Selvom undersøgelser større skala naturligvis ville skabe en større vægt på den konstatering, dette udgør stadig den største database af sin art, kun begrænset af praktiske overvejelser (fx at kombinere data fra flere søgemaskiner eller indsamling af data over en længere periode). Det er sandsynligt, at resultaterne ville kunne reproduceres i andre tilsvarende store undersøgelser.

Til trods for disse begrænsninger, viser denne undersøgelse, at UGC internetdata kan anvendes til at undersøge medicinske spørgsmål i stor skala. Overvågning brugernes søgemønstre kan hjælpe Websites til at forbedre og skræddersy kommunikationsstrategier for at imødekomme patienternes dynamiske behov, som disse foranstaltninger er kendt for at forbedre brugeroplevelsen [39]

. Endnu vigtigere, vores resultater gør det muligt for lægerne at forstå mere fuldt informationsbehovet hos patienter og fremhæve vigtigheden af ​​en effektiv og omfattende informationsoverførsel mellem læger og deres patienter, fra den allerførste dag mistanke gennem processen med diagnose. Ved at forstå brugsmønstre internettet, kan lægerne bruge dette værktøj som en stærk partner snarere end en kilde til nød i plejen af ​​deres patienter. Desuden Internet indholdsudbydere nødt til at tilpasse deres indhold ved at tage patientens søgehistorik i betragtning, når der tjener indhold, som vores resultater viser, at information har brug ændringer over tid.

Be the first to comment

Leave a Reply