PLoS ONE: underskrifter Selection i Fusion Udskrifter følge af kromosomtranslokationer i Human Cancer

Abstrakt

Baggrund

tilbagefald og ikke-tilfældig fordeling af translokation breakpoints i humane tumorer er normalt tilskrives lokale sekvens funktioner til stede i nærheden af ​​breakpoints. Men er det også blevet foreslået, at funktionelle begrænsninger kan bidrage til at afgrænse positionen af ​​translokation breakpoints i generne involveret, men har manglet en kvantitativ analyse af et sådant bidrag.

Metode

Vi har analyseret to velkendte underskrifter funktionel udvælgelse, såsom læsning-frame kompatibilitet og ikke-tilfældige kombinationer af proteindomæner, på en omfattende datasæt af fusionsproteiner som følge af kromosomale translokationer i kræft.

konklusioner

Vores data giver stærk eksperimentel understøttelse for konceptet, at positionen af ​​translokation breakpoints i genomet af cancerceller bestemmes i vid udstrækning af behovet for at kombinere visse proteindomæner og holde en intakt læseramme i fusionstranskripter. Derudover de oplysninger, som vi har samlet giver et samlet overblik over de onkogene mekanismer og domæne arkitekturer, der bruges af fusionsproteiner. Dette kan anvendes til at vurdere den funktionelle betydning af nye kromosomale translokationer og til at forudsige placeringen af ​​breakpoints i de involverede gener

Henvisning:. Ortiz de Mendibil I, Vizmanos JL, Novo FJ (2009) underskrifter Selection i Fusion Afskrifter SKYLDES kromosomtranslokationer i human Cancer. PLoS ONE 4 (3): e4805. doi: 10,1371 /journal.pone.0004805

Redaktør: Michael J. Pazin, National Institute on Aging (NIA), National Institutes of Health (NIH), USA

Modtaget: 8 oktober 2008; Accepteret: 30 januar 2009; Udgivet: 12 Mar 2009

Copyright: © 2009 Ortiz de Mendibil et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde er finansieret med hjælp fra Institute of Health Carlos III (FIS PI040037), spanske ministerium for Undervisning og Videnskab (SAF 2007-62.473), den PIUNA Program fra University of Navarra og Caja Navarra Foundation gennem Program “Du vælger , du beslutter dig “(Projekt 10,830). F.J.N er modtageren af ​​en “Jerónimo de Ayanz” pris fra regeringen i Navarra. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

De fleste cancerceller vise en vis form for kromosomal omlejring. Ud fra følgende betragtninger solide tumorer normalt få komplekse karyotyper med mange forskellige typer af kromosomale omlejringer, mange blodkræftsygdomme og visse sarkomer display kun én eller nogle få afvigelser, som regel balancerede kromosomale translokationer, som i nogle tilfælde har vist sig at være den initierende begivenhed i tumor udvikling [ ,,,0],1], [2]. Af denne grund, kromosomale translokationer er teknisk lettere at karakterisere i hæmatologiske cancerformer. Omfattende analyse af kromosomale translokationer i humane maligniteter i løbet af de sidste tre årtier har afsløret to vigtigste resultater, som sådanne rearrangementer driver kræft progression: i) promotor exchange (hovedsageligt i lymfoide neoplasmer), og ii) oprettelse af kimære gener, der er oversat som fusionsproteiner (myeloide leukæmier og nogle solide tumorer) [3]. Ligeledes den konsensus afledt af disse studier tyder på, at kromosomale translokationer er resultatet af misrepaired DNA dobbelt-strenget pauser (DSB) i somatiske celler [4] – [7]. -kromosomtranslokationer Resulterer i kimære fusionstranskripter udgør en vigtig gruppe af gensidige translokationer, der tegner sig for 20% af cancer sygelighed hos mennesker [3], og har potentiale til at initiere tumorvækst fordi deres proteinprodukter indeholder domæner fra begge fusionspartnere. Tilstedeværelsen af ​​heterologe proteindomæner i de samme kimære protein resulterer i deregulerede biologiske aktiviteter, der i sidste ende føre til udvikling af cancer.

Nogle af de balancerede kromosomale translokationer findes i tumorer er tilbagevendende, i den forstand, at de er til stede i forskellige patienter med samme tumortype, eller endog i forskellige tumortyper [8]. Endvidere har karakterisering af fusionssekvenser på det molekylære niveau i forskellige patientprøver vist, at i det mindste for nogle få gener, breakpoints tendens til at klynge i specifikke regioner. Som et resultat, fordelingen af ​​translokation breakpoints fundet i tumorprøver følger en ikke-tilfældigt mønster, med et par sider, hvor grænserne er hyppigere end forventet ved en tilfældighed. Selv om flere undersøgelser har behandlet den potentielle rolle nukleotid motiver og lokal sekvens funktioner som årsag til en sådan gentagelse [9] – [14], betydningen af ​​funktionelle faktorer i afgrænsning position translokation breakpoints er ikke blevet testet eksperimentelt. I denne henseende kunne en global analyse af kimære fusionstranskripter vise, om breakpoint gentagelse kan være resultatet af cellulær udvælgelse for de funktioner kodet af specifikke domæner, der er til stede i de respektive fusionsproteiner. Desuden kunne krav om at holde en intakt læseramme i fusionsproduktet også bidrage til at forklare den ikke-tilfældig fordeling af translokation breakpoints tværs disse gener.

For at teste denne hypotese har vi analyseret et omfattende sæt af kromosomale translokationer, der skaber oncogene fusionsproteiner i humane maligniteter, på udkig efter underskrifter fra funktionel udvælgelse. Vi samlet et katalog over de proteindomæner kodet af disse fusionsproteiner og visualiseres dem som et netværk af interagerende noder, opnå et samlet overblik over de protein domæner, der er bragt sammen til de samme fusionsproteiner. Vi analyserede også læserammen af ​​fusion udskrifter, med henblik på at bekræfte, at de oprindelige læserammer i partnerlandene gener blev holdt i-ramme i fusion udskrifter i et forhold højere end forventet ved en tilfældighed.

Materialer og metoder

Fusion sekvenser blev opnået fra TICdb version 2.1 (oktober 2007). TICdb er en frit tilgængelig database af gen-kortlagt translokation breakpoints i kræft, som beskriver den genomiske placering af 1.445 translokation breakpoints, svarende til 310 forskellige gener, i hæmatologiske, mesenkymale og epitelial maligniteter. Databasen blev oprettet ved hjælp af oplysninger fra

Mitelman Database over kromosomafvigelser i Cancer

(til rådighed på Cancer Genome Anatomi Project), to offentliggjorte kataloger af gener omarrangeret i kræft og vores egne søgninger [15]. Junction sekvenser af gensidige translokationer blev kortlagt på henvisningen sekvens af det humane genom ved hjælp BLAST. Alle translokation breakpoints er således henvist til præcis nukleotidpositioner eller genfragmenter (introns eller exons) inden specifik

Ensembl

udskrifter (Ensembl 38,36).

den fulgte procedure er opsummeret i figur 1. Fra TICdb fik vi oplysninger om 699 forskellige onkogene genfusioner, udelukket fra yderligere analyse alle de translokationer, hvor onkogene mekanisme har vist sig at være gen de-regulering af promotor udveksling i stedet for oprettelsen af ​​et fusionsprotein. Ligeledes 116 fusioner, hvor mindst et af partnerlandene gener bidrog ikke en genkendelig protein domæne til fusionsproteinet blev uninformative til analyse af protein domæne co-forekomster, og blev derfor udelukket fra datasættet, fordi de ikke er berettiget til studere. I alt vi analyseret 583 genfusioner, hvor begge partner gener bidrog en kommenteret proteindomæne til det kimære fusionsprotein genereres af translokation. To tredjedele (66%) af disse fusioner blev rapporteret i blodkræftsygdomme, 26% i mesenkymale kræftformer og 8% i epiteliale tumorer.

For hver fusion i TICdb (øverste rektangel viser en del af screenshot af en søgning efter translokationer, der involverer ETV6) vi gik til “Protein view” side af de respektive udskrifter (ENST00000266427 og ENST00000381652 i dette eksempel). Den nederste venstre boks viser ETV6 protein med de aminosyrer kodet af hver exon (blokke af skiftende farver), placeringen af ​​proteindomæner kommenteret i flere databaser (SMART, superfamilie, PFAM, PROSITE og PRINTS), placeringen af ​​breakpoint (lodret stiplede linje) og den del af peptid, som har bidraget til fusionsproteinet (horisontal linje med dobbelt pilespids). Det samme er vist for JAK2 i nederste højre boks. I begge tilfælde er exon flankerer fusion fremhævet (rød rektangel), med sit udgangspunkt og slutter læserammer vist i en boks ( “Splice information”).

TICdb viser placeringen af ​​hver breakpoint kortlagt til en bestemt intron eller exon af en specifik Ensembl transkript. Dette gjorde det muligt at bruge Ensembl “Protein view”, som giver en grafisk repræsentation af proteinet og alle de domæner kommenteret i SMART, Pfam, PROSITE og prints databaser, for at udvinde, for hvert gen fusion, den PFAM og PROSITE domæner som er medvirkende til fusionsproteinet ved hver enkelt af partnerlandene gener. Når Pfam og PROSITE domænerne overlappede og /eller havde samme INTERPRO tiltrædelse nummer, betragtes vi kun PFAM post. Unikke PROSITE domæner uden INTERPRO anmærkninger blev ignoreret; disse omfatter kompleksitet regioner med lav såsom prolin-rige, serinrige eller glutamin-rige regioner. Coiled coil-regioner blev inkluderet i analysen, da de er vigtige oligomeriseringsdomæner bruges i mange fusionsproteiner.

En vigtig overvejelse om proteindomæner i native proteiner er, at mange domæner generelt findes i kombination med andre domæner i samme protein. Det betyder, at fusionsproteiner normalt vil modtage to eller flere domæner fra hver af translokation partnere. I disse tilfælde er det vanskeligt at fastslå, om kun én (og hvilke) af domænerne er ansvarlig for de onkogene egenskaber af fusionsproteinet, eller om det er den bestemte kombination af domæner, der er ansvarlig for onkogen aktivitet. Af denne grund har vi grupperet domæner i domæne arkitekturer, dvs. grupper af domæner, der er fundet sammen i de samme native proteiner ifølge Pfam anmærkninger. To arkitekturer, EAD og COIL, var særlig vanskeligt at tildele. Den første omfatter EWS aktiveringsdomæne, som ikke er betegnet som et proteindomæne i PFAM men har vist sig at være ansvarlig for det transformerende potentiale af fusionsproteiner indeholdende denne del af EWS-proteinet. Interessant er dette domæne også påvises ved sekvenslighed, i FUS og TAF15 proteiner, der danner fusionsproteiner med arkitekturer findes i EWS fusionerne. Med hensyn til den coiled-coil domæne, det er til stede i mange proteiner, men mangler også en anmærkning i proteindomæne databaser. Det vises i enten alene eller i kombination med andre domæner fusionsproteiner, så det er ikke altid klart, om det transformerende potentiale af fusionsproteinet skyldes oligomerisering egenskaber af coiled-coil eller til den kombinerede tilstedeværelse af dette domæne med andre proteindomæner . Derfor har vi skabt en arkitektur (COIL) for de fusionsproteiner, hvor coiled coil er den eneste domæne til stede, plus diverse andre arkitekturer (COIL /andre) i de tilfælde, hvor der findes andre domæner i kombination med snoede spiraler. Den NUP arkitektur er omfattet af GLFG gentagelser af NUP proteinet.

Vi derefter genereres en liste over domæne arkitekturer, der er bragt sammen til det samme fusionsprotein. Disse par af domæne arkitekturer blev visualiseret som netværk, hvor knudepunkter repræsenterer et domæne arkitektur, og kanterne knytte disse arkitekturer, der er til stede i den samme fusionsprotein. Netværk blev oprettet ved hjælp af Cytoscape 2.5 (https://cytoscape.org/). Analyse af netværksparametre blev udført ved hjælp af NetworkAnalyzer plugin [16]. Supplerende Tabel S1 lister alle arkitekturer med de domæner, som omfatter hver arkitektur.

Ensembl “Protein visning” viser også læsning ramme, hvori hver kodning exon starter og ender (kasser vist i figur 1). Eftersom alle translokationer i TICdb kortlægges til specifikke introns eller exons, var vi i stand til at kontrollere, om de exons flankerer en translokation breakpoint har kompatible læserammer, det vil sige, hvis den sidste exon af 5’partner gen ender i den samme læseramme i som den første exon af 3’partner gen begynder. Som vist i figur 1, kan dette anvendes til at udlede, om fusionsgenet er resultatet af translokationen ville holde læserammen fra begge partner gener, og således oversættes som en i-ramme fusionsprotein. Da de fleste af fusionssekvenser analyserede stammer fra fusion udskrifter (splejset mRNA), disse sekvenser tager allerede højde for potentielle exon springe eller alternative splejsning begivenheder. I 43 af de 583 genfusioner analyserede læserammen af ​​begge exoner forekom uforenelig med en fusion i ramme produkt, så vi gik tilbage til den oprindelige sekvens for at kontrollere, om andre mekanismer havde genoprettet læserammen i fusionen transkript.

Resultater Salg

læseramme bevaring

efter strategi forklaret i Methods, analyserede vi læseramme forenelighed exoner flankerende translokation breakpoints, i 583 genfusioner, som koder for en potentiel fusionsprotein, i hvilket med begge partner gener bidrager en kommenteret protein domæne. Interessant nok endelige læseramme af 5′-exon og udgangsmaterialet læseramme af 3’exon forenelige i 540 af de analyserede fusioner, hvilket bekræfter, at en i-ramme-fusionsproteinet blev genereret på 93% af tilfældene. I nogle translokationer, brudpunktet faldt i midten af ​​en exon, men alligevel læserammen blev holdt på tværs af fusion. Dette illustreres af et sæt af gen fusioner mellem

FIP1L1

(5 ‘gen) og

PDGFRA

(3′ gen), hvor forskellige exoner af

FIP1L1

er fusioneret til afkortede versioner af exon 12 af

PDGFRA

(Ensembl afskrift ENST00000381354). Deletioner i denne exon altid resultere i en kompatibel læseramme med de tilsvarende exons af

FIP1L1

(exons 10, 11, 12 og 13 i

FIP1L1

udskrift ENST00000358575, hvilket ender i læsning rammer +3 , +1, +2 og +3 henholdsvis i version 38.36 af Ensembl), hvilket fører til fusion i ramme transkripter i alle fire konfigurationer.

i de resterende 43 fusioner læserammer flankerende exoner var ikke forenelige , så de ville ikke forventes at generere en i-ramme fusionsprotein. I disse tilfælde gik vi tilbage til den oprindelige fusion sekvens og fandt, at læsning ramme i 31 af disse (72%) var blevet restaureret af forskellige mekanismer som alternativ splejsning, indsættelse af intron regioner, indsættelse af ikke-templatede nukleotider eller sletning af exoniske nukleotider. Dette var særlig udbredt i fusionsproteiner involverer

EWSR1

,

FUS

og

TAF15

, da 48% af sådanne fusioner havde uforenelige læserammer, der blev korrigeret ved en af ​​disse mekanismer (24 ud af 50 genfusioner analyseret for disse gener). Efter nøje vurdering af de resterende 12 fusioner, hvor læsning rammer ikke var kompatible (2% af de samlede 583 fusioner), antog vi, at et funktionelt protein produkt ikke kan genereres i disse tilfælde.

Konstateringen af, at 98% af gen fusioner genererer udskrifter, der kan oversættes som i-frame proteinprodukter bekræfter, at læsning bevarelse ramme er af stor funktionel betydning i onkogene fusionsproteiner, da den forventede hyppighed af kompatible læserammer mellem to tilfældige exons (forudsat lige frekvenser på en, 2 og + 3 læserammer) er en tredjedel. Dette er en klar signatur af det stærke selektive tryk i somatiske celler, der favoriserer de fusion produkter, der kan køre onkogen transformation, og det har store konsekvenser i diskussionen om identiteten af ​​de faktorer, der styrer placeringen af ​​translokation breakpoints i kræftceller (se nedenfor).

protein domæne arkitekturer til stede i samme fusionsprotein

Et netværk graf af de involverede i kromosomale translokationer gener, der genererer fusionsproteiner (Supplerende figur S1) viser tre vigtigste uafhængige klynger, plus nogle mindre grafer som ikke er forbundet til nogen af ​​de vigtigste komponenter [15], [17]. Disse blev analyseret som beskrevet i afsnittet Fremgangsmåder, for at skabe et globalt netværk af domæne arkitekturer, der er bragt sammen til de samme fusionsproteiner i cancer (figur 2 og supplerende tekst S1). Topologiske parametre som graden fordeling viser, at netværket af genfusioner og netværket af domænenavne arkitekturer er både kompatible med skala-fri eller små-verden, men ikke tilfældigt, topologier. Antallet af knuder (114) i netværket af domænenavne arkitekturer (figur 2) er mindre end halvdelen af ​​antallet af gener omarrangeret i disse translokationer (235 knudepunkter i fig S1), hvilket indikerer, at de samme arkitekturer bruges i forskellige genfusion begivenheder. Ligeledes netværket af domæne arkitekturer har en mindre diameter (8 vs. 13) og en mindre karakteristisk vejlængde (3,66 vs. 4,83); som et resultat, netværkstæthed i netværket af domænenavne arkitekturer er mere end dobbelt densiteten af ​​netværket af genfusioner (0,0019 vs. 0,0008). Disse parametre hensyn til den lavere kompleksitet af netværket af domæne arkitekturer i forhold til nettet af genfusioner. kan findes en mere indgående diskussion af disse netværk i supplerende tekst S1, supplerende Figur S2, supplerende figur S3, supplerende figur S4 og supplerende Figur S5.

Alle domæne arkitekturer blev slået sammen, hvilket resulterer i en enkelt store komponent plus 6 andre mindre grafer. Ni noder med mere end 5 naboer (hubs) er vist med blåt. De tre vigtigste gen fusion netværk vist i supplerende Figur S1 er klart synlige i navene svarende til TK, NUP og COIL /HZ arkitekturer. Størrelsen af ​​hver node er tegn på dens grad (antal naboer).

To interessante funktioner er synlige i det netværk af domæne arkitekturer. Først alle arkitekturer afledt af de tre vigtigste genfusion netværk vises som en stor enkelt graf, der angiver, at nogle domæne arkitekturer er fælles for alle gen net. Ligeledes er nogle af de arkitekturer fra de 21 små gen fusion grafer også inkluderet i denne store del, så kun 6 små komponenter forbliver uden forbindelse til hovednettet af domænenavne arkitekturer. For det andet, de flere forbundne knudepunkter (hubs with≥5 naboer, der er vist i blåt i figur 2) identificere de vigtigste klasser af fusionsproteiner findes i kræft, der er, dem, der involverer tyrosinkinase (TK) domæne, den EWS aktivering domæne (EAD ), runt domæne, ligandbindingsdomænet af den nukleare hormonreceptor (HRMN), aT-hook-DNA-bindingsdomænet (hOOK og COIL /HZ), de GLFG gentagelser (Nup) og viklede spoler (COIL). Dette antyder, at netværket indfanger de vigtigste biologiske temaer, der har kendskab til blive brugt af fusionsproteiner i cancer.

Det fund, at kun visse kombinationer af protein domæner er til stede i onkogene fusionsproteiner, der danner et netværk af ikke œ RANDOM topologi, indebærer, at sådanne kombinationer er resultatet af særskilte funktionelle begrænsninger. Som nævnt ovenfor, er dette en underskrift af de trådløse udvælgelse pres, der dikterer hvilke kromosomale translokationer er til stede i kræftceller.

For at foregribe, hvordan dette netværk vil blive påvirket af opdagelsen af ​​nye translokationer, vi analyserede kromosomal translokationer, der blev offentliggjort efter begyndelsen af ​​dette arbejde (oktober 2007) og dermed endnu ikke er medtaget i TICdb på det tidspunkt [18] – [33]. Vi indsamlede 17 genfusioner, der genererer et fusionsprotein med annoterede proteindomæner, der beskriver 9 nye gener og 7 nye domæne arkitekturer (to af de nye gener bidrog en allerede beskrevet arkitektur). Vi observerede også to nye kombinationer af tidligere beskrevne domæne arkitekturer. Derudover er der i et tilfælde en 3 ‘partner gen

(TCF3)

, tidligere beskrevet som 5′ fusionspartner, bidrager med en særskilt domæne arkitektur i denne nye sag. Analysen af ​​disse nye fusioner tyder på, at netværket af domæne arkitekturer, selvom endnu ikke afsluttet, indeholder de fleste af de arkitekturer anvendes af onkogene fusionsproteiner, og vokser i et langsommere tempo end det netværk af gen fusioner.

diskussion

Vi har udført en uvildig undersøgelse af litteratur og af alle offentlige data til rådighed for os om kromosomale translokationer, der skaber fusionsproteiner i humane kræftformer. Fusions, der ikke var informativt for denne analyse blev udelukket, nemlig dem, der er involveret i promoter udveksling (som ikke skaber fusionsproteiner), og dem, hvor en af ​​partnerlandene gener ikke bidrager en genkendelig domæne til fusionsproteinet (som ikke er oplysende for analysen af ​​domænet samtidig forekomst). Derfor skal det holdes for øje, at de data, der præsenteres her, gælder for kromosomale translokationer, som genererer fusionsproteiner indeholdende proteindomæner kommenteret i Pfam. Vores analyse afslørede to underskrifter fra funktionel valg: læsning-frame kompatibilitet og ikke-tilfældige samtidig forekomst af protein domæner. Begge funktioner kan være vigtige determinanter for placeringen af ​​translokation breakpoints i kræftceller. Derudover kan vores data bidrage til at forudsige nye translokationer og vurdere den funktionelle relevans af nye genfusioner opdaget i hæmatologiske og solide tumorer.

Rolle funktionel udvælgelse i den situation translokation breakpoints i kræftceller

de to underskrifter fra funktionel udvælgelse, som vi har analyseret i fusion udskrifter (nemlig, læsning bevarelse ramme og ikke-tilfældige kombinationer af protein domæner) tyder på, at sådanne kræfter kan være vigtige faktorer ved fastsættelsen af ​​den ikke-tilfældig fordeling af translokation breakpoints, der er set i humane cancere. I denne henseende den udbredte opfattelse, at de lokale sekvens faktorer er ansvarlige for tilstedeværelsen af ​​translokation breakpoints ved specifikke genomiske steder beror på den antagelse, at translokation breakpoints afslører en oversigt over alle DSB’er genereret i disse celler. Således da translokation breakpoints er ikke-tilfældigt fordelt, er følgeslutning lavet, at DSBs oprindeligt er skabt ikke-tilfældigt. Men sekvens elementer, der er ansvarlige for produktion af DSBs (kort sekvens motiver, topoisomerase II steder, spredte gentagelser, intron transkriptionsinitiering sites, korsformede strukturer osv) er ret almindelig i hele genomet, så det er rimeligt at antage, at de fleste af DSBs der er skabt på tværs af genomet under hele en somatisk celle er blevet korrekt repareret, og at kun en lille delmængde af misrepaired DSB’er vil resultere i onkogene fusioner og vil med tiden blive fundet i tumor prøver. I denne forbindelse skal det erindres, at analysen af ​​tumorprøver repræsenterer et ekstremt tilfælde af konstatering skævhed: per definition vil kun translokationer, der har været vigtige for tumorvækst påvises, mens mange andre mulige translokationer, der ikke giver en proliferativ fordel til cellen vil ikke. Nogle translokationer, for eksempel ville forventes at være skadelige for cellen, da to forskellige gen alleler (en allel af hvert gen) er blevet inaktiveret ved pauser, således at celler, der bærer disse translokationer i sidste ende vil forsvinde fra vævet. Andre omlejringer vil være funktionelt neutral, og den resulterende fusionsgen vil ikke have en fordelagtig biologisk funktion. I sidste ende er de translokationer, der findes i tumorprøver er resultatet af den klonale ekspansion af celler, der huser translokationer med potentiale til at fremme tumorvækst fordi de skaber onkogene fusionsgener. De specifikke breakpoints nærede af disse translokationer udgør delmængde af ikke-vilkårlige translokation breakpoints, der findes i cancerceller.

Dette er illustreret i figur 3, som viser to gener teoretisk i stand til at deltage i en gensidig translokation med oncogen egenskaber på grund af de domæner, der er til stede i deres respektive proteiner. Selv hvis den første DSBs blev fordelt ensartet over de gener [34], er det indlysende, at ikke alle mulige translokationer vil skabe et fusionsgen med onkogent potentiale. Ser man på positionen af ​​de regioner, der koder for de nødvendige proteindomæner, og i betragtning læserammer de forskellige exoner er involveret, bliver det klart, at et onkogent fusionsprotein kun vil blive genereret, hvis breakpoints ligger inden for visse introner. Andre mulige breakpoint kombinationer ville føre til tab af et vigtigt funktionelt domæne i fusionsproteinet, eller til en out-of-frame produkt, og vil ikke blive begunstiget i tumorprøver. En klar implikation af dette er, at den opfattede “ikke-tilfældighed” i det genomiske fordeling af translokation breakpoints ikke nødvendigvis relateret til den oprindelige lokalisering af DSBs, men kunne være resultatet af udvælgelsesprocessen, hvorved kun nogle få af disse DSB’er vinder overleve i cellerne i en tumor.

Tre exoner af to hypotetiske gener er vist (exons a, B og C i blå, exon 1, 2 og 3 i orange). Den indledende og afsluttende læseramme af hver exon er vist (1, 2 eller 3). Exon A og B i den øverste gen koder for et protein domæne (rød bar), hvorimod exon 3 af de nederste gen koder for et andet protein domæne (grøn bar). Selv om dobbeltstrengede pauser (DSBs, gule lyn symboler) blev skabt ensartet over sekvensen af ​​begge gener, kun de breakpoint kombinationer fører til i-ramme-fusionsproteiner, som koder for begge proteindomæner vil vise onkogent potentiale. Som et resultat, vil translokation breakpoints findes i tumorprøver klynge til specifikke gen regioner (lodret blå pile).

Forudsigelse af nye fusionsproteiner i hæmatologiske og solide tumorer

Hvis de to signaturer identificeret i dette arbejde er vigtige determinanter for breakpoint lokalisering, så vores resultater bør være nyttige til forudsigelse af genfusioner, der endnu ikke er fundet i tumorer. Først kan de oplysninger om hvilket domæne arkitekturer er til stede i samme fusionsprotein anvendes til at vælge alle de gener, der koder for et bestemt par af domænenavne arkitekturer. Dette vil forudsige flere genfusioner der er potentielt onkogen. Information om læserammer exonerne tilhører sådanne gener bør identificere hvilken specifik fusioner (hvis nogen) er i stand til at frembringe en i-ramme-fusionsprotein, der omfatter den ønskede kombination af proteindomæner. Endnu vigtigere er, bør denne analyse også identificere hvilke intronerne er mest tilbøjelige til at indeholde breakpoints, og dermed medvirke til udformningen af ​​molekylære strategier til påvisning af disse formodede fusionstranskripter.

Et oplagt implikation fra vores arbejde er, at mange potentielle genfusioner kan generere den samme kombination af domæne arkitekturer, fordi hver arkitektur normalt kodes af flere gener. Imidlertid er det almindeligt antaget, at de fleste af kromosomale translokationer er ansvarlige for udviklingen af ​​human cancer allerede er blevet beskrevet [8], [17]. Selv om nogle nye tilfælde offentliggøres hvert år, de fleste af dem rapporterer nye breakpoints i tidligere kendte gen fusioner eller nye fusioner mellem gener, der tidligere var blevet fundet fusioneret til andre partnere. Det er ikke klart, hvorfor mange af de potentielle hidtil ukendte genfusioner ikke er blevet opdaget. En sandsynlig forklaring er, at de involverede gener ikke opfylder nogle af de kriterier, der er nødvendige for en gensidig translokation at finde sted, såsom nærhed inden for det nukleare rum eller co-transskription i de samme nukleare transskription fabrikker [35] – [39] . Alternativt kan nogle af disse nye genfusioner forblive uopdaget, fordi de aldrig er blevet søgt efter, da de fleste undersøgelser fokuserer på påvisning af kendte translokationer. I denne forbindelse er det interessant at overveje de seneste undersøgelser, hvor genomet af forskellige typer af cancerceller er blevet forhørt i en saglig måde [40] – [43]. I tilfælde af en diploid prøve fra en leukæmi patient, massivt parallelle sekventering afslørede hidtil ukendte punktmutationer, men ingen genomiske rearrangementer [40]. End Sequence profilering cellelinier fra solide tumorer afslørede mange somatiske genomiske omlejringer, men kun få af disse var genfusioner. For eksempel, Campbell et al. [41] bruges massivt parallelle parret ende sekventering i to lungekræft cellelinier og fandt 22 somatiske interchromosomal omrokeringer i NCI-H2171 cellelinie, men ingen i NCI-H1770. Af dem, udtrykte kun en fusion transcript blev identificeret, selv om det var forudsagt til at være ude-af rammen. Raphael et al. [42] fundet en fusion mellem

HYDIN

gen og en anonym gen i MCF7 metastatisk brystcancer cellelinje. En anden fusion mellem

SCL12A2

en udtrykt sekvens tag blev kun fundet i high passage MCF7-celler. I denne samme cellelinie, hvori kromosomafvigelser er tidligere blevet beskrevet af Spectral Karyotyping (SKY) og array-Comparative Genomic hybridisering (CGH), Hampton et al. [43] fundet 10 genfusioner hjælp ende-sekvens profilering med massivt parallel sekventering. Af disse blev fundet kun fire, der skal udtrykkes, men deres onkogene potentiale blev ikke direkte testet. I betragtning af at disse undersøgelser blev udført på cellelinjer, at antallet af nye udtrykte gen fusioner er forholdsvis lav.

Disse nye data er også relevante for den nuværende debat om “driver” og “passager” mutationer i kræft genomer. På grund af den iboende ustabilitet af genomerne og den klonale natur af tumorigene proces, der forventes mange afvigelser, der skal findes, når cancer genomer forespurgt uvildigt, hvoraf størstedelen vil være passager aberrationer med ingen funktionel relevans for den onkogene proces . I denne sammenhæng er der et stort behov for nye tilgange, der kan skelne de genomiske forandringer, der drev tumor initiering eller udvikling fra neutrale ændringer, der er erhvervet af klon, men ikke har nogen funktionel betydning. Vores resultater understreger to funktioner, der kan være nyttige i denne henseende.

Be the first to comment

Leave a Reply