1 Principle

2 Preparation

3 Load RNAseq results

4 Threshold filtering (DEGs)

4.1 Scatter plot

5 Assigning genes

5.0.1 Venn diagram

6 Scenario 1 (Ideal)

6.1 Positively regulated by PRMT1

6.1.1 Make venn only positive
6.1.2 Datatable overlap positive
6.1.3 Enrichment analysis

6.2 Negatively regulated by PRMT1

6.2.1 Make venn only negative
6.2.2 Datatable overlap negative
6.2.3 Enrichment analysis

7 Scenario 2

7.1 Knockdown

7.1.1 Compare using venn diagram
7.1.2 Datatable overlap
7.1.3 Enrichment analysis (Positive)
7.1.4 Enrichment analysis (negative)

7.2 Recovery

7.2.1 Datatable
7.2.2 Enrichment (Positive)
7.2.3 Enrichment (Negative)

8 Scenario 3

8.1 Make venn

8.1.1 Datatable
8.1.2 Enrichment (Positive)
8.1.3 Enrichment (Negative)

9 Conclusion

9.1 KEGG term selected
9.2 Connecting with clinical specimen

9.2.1 Gene filtering
9.2.2 Heatmap
9.2.3 Correlation

9.2.3.1 Corelation matrix
9.2.3.2 Correlation plot
9.2.3.3 Datatable correlation
9.2.3.4 Selected Heatmap and Cor. Matrix

1 Principle

Sample types :

Scramble
siPRMT1
shPRMT1
shPRMT1 + Flag-PRMT1

2 Preparation

Install and load libraries

library(kableExtra)
library(tidyverse)
library(dplyr)
library(ggrepel)
library('ggvenn')
library(DT)
library(forcats)
scale_fill_aziz <- function(...){
  library(scales)
  discrete_scale("fill","aziz",manual_pal(values = c("#386cb0","#fdb462","#7fc97f","#a6cee3","#fb9a99","#984ea3","#ffff33")), ...)
  
}

scale_colour_aziz <- function(...){
  library(scales)
  discrete_scale("colour","aziz",manual_pal(values = c("#386cb0","#fdb462","#7fc97f","#ef3b2c","#662506","#a6cee3","#fb9a99","#984ea3","#ffff33")), ...)
}
theme_Publication <- function(base_size=14, base_family="helvetica") {
  library(grid)
  library(ggthemes)
  (theme_foundation(base_size=base_size, base_family=base_family)
    + theme(plot.title = element_text(face = "bold",
                                      size = rel(1.2), hjust = 0.5),
            text = element_text(),
            panel.background = element_rect(colour = NA),
            plot.background = element_rect(colour = NA),
            panel.border = element_rect(colour = NA),
            axis.title = element_text(face = "bold",size = rel(1)),
            axis.title.y = element_text(angle=90,vjust =2),
            axis.title.x = element_text(vjust = -0.2),
            axis.text = element_text(), 
            axis.line = element_line(colour="black"),
            axis.ticks = element_line(),
            panel.grid.major = element_line(colour="#f0f0f0"),
            panel.grid.minor = element_blank(),
            legend.key = element_rect(colour = NA),
            legend.position = "bottom",
            legend.direction = "horizontal",
            legend.key.size= unit(0.2, "cm"),
            legend.margin = unit(0, "cm"),
            legend.title = element_text(face="italic"),
            plot.margin=unit(c(10,5,5,5),"mm"),
            strip.background=element_rect(colour="#f0f0f0",fill="#f0f0f0"),
            strip.text = element_text(face="bold"),
            plot.subtitle = element_text(hjust = 0.5)
    ))
}

create_dt<-function(x){
  DT::datatable(x,
                extensions = 'Buttons',
                options = list(dom='Blfrtip',
                               buttons=c('copy', 'csv', 'excel','pdf', 'print'),
                               lengthMenu=list(c(10,25,50,-1),
                                               c(10,25,50,'All'))))
}

3 Load RNAseq results

fc<-read.delim("~/Repository/repository/docs/PRMT1/FC PRMT.csv") #load dataframe and name it fc
head(fc)

##   Gene.symbol Shprmt1..Scrmbl Siprmt1..Scrmbl ShprmtOE..Scrmbl
## 1       IFI27           6.639         230.309          150.286
## 2      SUCNR1           6.262          18.627           13.008
## 3         FN1           6.262           2.964            3.067
## 4       SYTL2           5.833           6.151           15.023
## 5      LGALS9           5.692          17.207           26.792
## 6       CDH17           4.940           2.335            5.451
##   ShprmtOE..Shprmt1 Scrmbl Shprmt1 Siprmt1 ShprmtOE
## 1            22.638  1.996   4.727   9.844    9.228
## 2             2.077  1.795   4.441   6.014    5.496
## 3             0.490  1.795   4.441   3.362    3.412
## 4             2.575  1.356   3.900   3.977    5.265
## 5             4.707  3.983   6.492   8.088    8.727
## 6             1.104  2.214   4.518   3.437    4.660

fc<-fc %>% 
  dplyr::select(1,2,3,5,6,7,8,9) #remove unneccessary column (shrecovery/Scramble)
head(fc)

##   Gene.symbol Shprmt1..Scrmbl Siprmt1..Scrmbl ShprmtOE..Shprmt1 Scrmbl Shprmt1
## 1       IFI27           6.639         230.309            22.638  1.996   4.727
## 2      SUCNR1           6.262          18.627             2.077  1.795   4.441
## 3         FN1           6.262           2.964             0.490  1.795   4.441
## 4       SYTL2           5.833           6.151             2.575  1.356   3.900
## 5      LGALS9           5.692          17.207             4.707  3.983   6.492
## 6       CDH17           4.940           2.335             1.104  2.214   4.518
##   Siprmt1 ShprmtOE
## 1   9.844    9.228
## 2   6.014    5.496
## 3   3.362    3.412
## 4   3.977    5.265
## 5   8.088    8.727
## 6   3.437    4.660

colnames(fc)

## [1] "Gene.symbol"       "Shprmt1..Scrmbl"   "Siprmt1..Scrmbl"  
## [4] "ShprmtOE..Shprmt1" "Scrmbl"            "Shprmt1"          
## [7] "Siprmt1"           "ShprmtOE"

{colnames(fc)[1]<-"Gene"
colnames(fc)[2]<-"FC.shPRMT1.per.Scramble"
colnames(fc)[3]<-"FC.siPRMT1.per.Scramble"
colnames(fc)[4]<-"FC.shPRMT1plusPRMT1.per.shPRMT1"
colnames(fc)[5]<-"Scramble"
colnames(fc)[6]<-"shPRMT1"
colnames(fc)[7]<-"siPRMT1"
colnames(fc)[8]<-"shPRMT1plusPRMT1"} #change the column name

4 Threshold filtering (DEGs)

Differentially expressed genes (DEGs) commonly selected after threshold filtering using both log FC value and p-value.
But since there is no replication in the sample, we can filter DEGs based on log FC value only.

fc<-fc %>% 
  mutate(grupSH=case_when(FC.shPRMT1.per.Scramble > 2 ~ 'Upregulated',
                        FC.shPRMT1.per.Scramble < 0.5 ~ 'Downregulated',
                        TRUE ~ 'Not-regulated')) %>% 
  mutate(grupSI=case_when(FC.siPRMT1.per.Scramble > 2 ~ 'Upregulated',
                          FC.siPRMT1.per.Scramble < 0.5 ~ 'Downregulated',
                          TRUE ~ 'Not-regulated')) %>% 
  mutate(grupREC=case_when(FC.shPRMT1plusPRMT1.per.shPRMT1 > 2 ~ 'Upregulated',
                           FC.shPRMT1plusPRMT1.per.shPRMT1 < 0.5 ~ 'Downregulated',
                          TRUE ~ 'Not-regulated'))

create_dt(fc)

## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html

Show entries

Search:

	Gene	FC.shPRMT1.per.Scramble	FC.siPRMT1.per.Scramble	FC.shPRMT1plusPRMT1.per.shPRMT1	Scramble	shPRMT1	siPRMT1	shPRMT1plusPRMT1	grupSH	grupSI	grupREC
1	IFI27	6.639	230.309	22.638	1.996	4.727	9.844	9.228	Upregulated	Upregulated	Upregulated
2	SUCNR1	6.262	18.627	2.077	1.795	4.441	6.014	5.496	Upregulated	Upregulated	Upregulated
3	FN1	6.262	2.964	0.49	1.795	4.441	3.362	3.412	Upregulated	Upregulated	Downregulated
4	SYTL2	5.833	6.151	2.575	1.356	3.9	3.977	5.265	Upregulated	Upregulated	Upregulated
5	LGALS9	5.692	17.207	4.707	3.983	6.492	8.088	8.727	Upregulated	Upregulated	Upregulated
6	CDH17	4.94	2.335	1.104	2.214	4.518	3.437	4.66	Upregulated	Upregulated	Not-regulated
7	TOX3	4.921	4.303	0.9	3.527	5.826	5.632	5.674	Upregulated	Upregulated	Not-regulated
8	CD70	4.499	1.233	0.218	1.795	3.964	2.096	1.77	Upregulated	Not-regulated	Downregulated
9	APOL1	4.212	44.015	5.116	2.907	4.981	8.366	7.336	Upregulated	Upregulated	Upregulated
10	PGM2L1	4.209	4.275	0.738	4.554	6.627	6.65	6.189	Upregulated	Upregulated	Not-regulated

Showing 1 to 10 of 25,737 entries

Previous1 2 3 4 5…2,574Next

4.1 Scatter plot

# SH vs Scramble
fc %>% 
  ggplot(aes(x=Scramble,y=shPRMT1,color=grupSH))+
  geom_point(size=1.5)+
  geom_label_repel(aes(label=ifelse(Gene == 'PRMT1',as.character(Gene),'')),
                  box.padding   = .35, 
                  point.padding = 0.5,
                  max.overlaps = Inf,
                  segment.color = 'grey50',show.legend = F)+ #label PRMT1
  theme_classic()+
  scale_colour_manual(values = c('#a6cee3','gray','#fb9a99'))+
  theme_Publication()+
  theme(aspect.ratio = 1)+
  ylab("sh-PRMT1")+
  xlab("Scramble")+
  ggtitle("Group SH")

fc %>% 
  ggplot(aes(x=Scramble,y=siPRMT1,color=grupSI))+
  geom_point(size=1.5)+
  geom_label_repel(aes(label=ifelse(Gene == 'PRMT1',as.character(Gene),'')),
                  box.padding   = .35, 
                  point.padding = 0.5,
                  max.overlaps = Inf,
                  segment.color = 'grey50',show.legend = F)+ #label PRMT1
  theme_classic()+
  scale_colour_manual(values = c('#a6cee3','gray','#fb9a99'))+
  theme_Publication()+
  theme(aspect.ratio = 1)+
    ylab("si-PRMT1")+
  xlab("Scramble")+
  ggtitle("Group SI")

fc %>% 
  ggplot(aes(x=shPRMT1,y=shPRMT1plusPRMT1,color=grupREC))+
  geom_point(size=1.5)+
  geom_label_repel(aes(label=ifelse(Gene == 'PRMT1',as.character(Gene),'')),
                  box.padding   = .35, 
                  point.padding = 0.5,
                  max.overlaps = Inf,
                  segment.color = 'grey50',show.legend = F)+ #label PRMT1
  theme_classic()+
  scale_colour_manual(values = c('#a6cee3','gray','#fb9a99'))+
  theme_Publication()+
  theme(aspect.ratio = 1)+
  ylab("sh-PRMT1 + Flag-PRMT1")+
  xlab("sh-PRMT1")+
  ggtitle("Group Recovery")

5 Assigning genes

* Make a venn diagram to see overlapping DEGs in 3 conditions.

5.0.1 Venn diagram

# Filtered regulated genes to make venn
SH.regulated<-fc %>% 
  filter(grupSH == 'Downregulated' | grupSH == 'Upregulated')
SI.regulated<-fc %>% 
  filter(grupSI == 'Downregulated' | grupSI == 'Upregulated')
REC.regulated<-fc %>% 
  filter(grupREC == 'Downregulated' | grupREC == 'Upregulated')

D<-list('Group SH'=as.character(SH.regulated$Gene),
        'Group SI'=as.character(SI.regulated$Gene),
        'Group Recovery'=as.character(REC.regulated$Gene))

ggvenn(D,fill_color = c("#386cb0","#fdb462","gray"),fill_alpha = .3,text_size = 5,show_percentage = F)+
  ggtitle("Overlap of all genes passing the threshold (DEGs)")

* From venn we can see about 119 DEGs overlap, then we filter again and assign positive or negatively regulated by PRMT1

#what are those genes?
overlap<-as.data.frame(intersect(as.character(REC.regulated$Gene),intersect(x=as.character(SH.regulated$Gene),y=as.character(SI.regulated$Gene))))
colnames(overlap)[1]<-"Gene"
overlap

##             Gene
## 1          IFI27
## 2         SUCNR1
## 3            FN1
## 4          SYTL2
## 5         LGALS9
## 6          APOL1
## 7           IFI6
## 8        SLC16A3
## 9         INPP5D
## 10          NME9
## 11          BST2
## 12        PARP14
## 13         CXCR4
## 14     LOC286437
## 15         DDX58
## 16       RARRES3
## 17        IL18R1
## 18         EVI5L
## 19        CDC14A
## 20         IFIT3
## 21           ID2
## 22          OAS2
## 23          NTN4
## 24         STON2
## 25          NEK7
## 26         GCNT7
## 27       DCLRE1C
## 28          CTSS
## 29         HERC6
## 30         IFIT1
## 31         GSDMB
## 32        ATP11B
## 33         RSAD2
## 34          RND3
## 35         IFI16
## 36           MX1
## 37          PSCA
## 38         AADAC
## 39          MLH3
## 40      C6orf222
## 41        CLDN18
## 42           KLB
## 43           CFB
## 44         FALEC
## 45         NEAT1
## 46        SP140L
## 47        NFKBIZ
## 48          FSBP
## 49          XAF1
## 50        ALPPL2
## 51        GRIN2C
## 52         BIRC3
## 53          IL32
## 54         MGAT3
## 55           CFI
## 56        ZDHHC1
## 57       ANKRD37
## 58         DTX3L
## 59         PTPRB
## 60         NPTXR
## 61         GSTA1
## 62        SPRR1A
## 63         TTC37
## 64        CCDC68
## 65         HLA-F
## 66         BISPR
## 67      PPP1R14C
## 68      IRAK1BP1
## 69        KISS1R
## 70          CARF
## 71        INSIG2
## 72        MTHFSD
## 73       SULT2B1
## 74           CA9
## 75         LAMP3
## 76        PDIK1L
## 77           PTS
## 78         CEBPB
## 79       C5orf56
## 80         LIN54
## 81        TMEM91
## 82        RNF128
## 83         TDRD7
## 84     LOC730183
## 85       DCLRE1A
## 86         DAPK1
## 87         VEPH1
## 88     NUP50-AS1
## 89         TFB2M
## 90           MYC
## 91        IFNGR1
## 92     LOC654342
## 93      CALCOCO1
## 94      KIAA0895
## 95        AMIGO3
## 96          TTC5
## 97       PCOLCE2
## 98        COPS7A
## 99  LOC101927550
## 100       EIF1AD
## 101         AKT3
## 102        INSM1
## 103     C16orf91
## 104         IL18
## 105      ALDH3A1
## 106         DOK3
## 107     TP53INP2
## 108       S100A5
## 109         PIM1
## 110       SNHG21
## 111         PLAU
## 112         SIK1
## 113        ALG13
## 114         AQP3
## 115       GTPBP2
## 116        EPHA2
## 117     MINOS1P1
## 118  MINOS1-NBL1
## 119        PRMT1

#leftjoin to other parameter
overlap<-overlap %>% 
  left_join(fc) %>% 
  select(Gene,grupSH,grupSI,grupREC)

create_dt(overlap)

Show entries

Search:

	Gene	grupSH	grupSI	grupREC
1	IFI27	Upregulated	Upregulated	Upregulated
2	SUCNR1	Upregulated	Upregulated	Upregulated
3	FN1	Upregulated	Upregulated	Downregulated
4	SYTL2	Upregulated	Upregulated	Upregulated
5	LGALS9	Upregulated	Upregulated	Upregulated
6	APOL1	Upregulated	Upregulated	Upregulated
7	IFI6	Upregulated	Upregulated	Upregulated
8	SLC16A3	Upregulated	Upregulated	Downregulated
9	INPP5D	Upregulated	Downregulated	Downregulated
10	NME9	Upregulated	Upregulated	Downregulated

Showing 1 to 10 of 131 entries

Previous1 2 3 4 5…14Next

6 Scenario 1 (Ideal)

6.1 Positively regulated by PRMT1

6.1.1 Make venn only positive

# We can make venn again only positive
pos.SH<-SH.regulated %>% 
  filter(grupSH=='Downregulated')
pos.SI<-SI.regulated %>% 
  filter(grupSI=='Downregulated')
pos.REC<-REC.regulated %>% 
  filter(grupREC=='Upregulated')

s1.list.pos<-list('Group SH'=as.character(pos.SH$Gene),
                   'Group SI'=as.character(pos.SI$Gene),
                   'Group Recovery'=as.character(pos.REC$Gene))

v1pos<-ggvenn(s1.list.pos,fill_color = c("#386cb0","#fdb462","gray"),fill_alpha = .3,text_size = 5,show_percentage = F)+
  ggtitle("Overlap DEGs",subtitle = "Positively regulated by PRMT1")

v1pos

6.1.2 Datatable overlap positive

S1.Positive.cor<-(overlap %>% filter(grupSH == 'Downregulated' & grupSI == 'Downregulated' & grupREC == 'Upregulated'))
create_dt(S1.Positive.cor)

Show entries

Search:

	Gene	grupSH	grupSI	grupREC
1	PPP1R14C	Downregulated	Downregulated	Upregulated
2	MTHFSD	Downregulated	Downregulated	Upregulated
3	PTS	Downregulated	Downregulated	Upregulated
4	LOC730183	Downregulated	Downregulated	Upregulated
5	TFB2M	Downregulated	Downregulated	Upregulated
6	MYC	Downregulated	Downregulated	Upregulated
7	LOC654342	Downregulated	Downregulated	Upregulated
8	AMIGO3	Downregulated	Downregulated	Upregulated
9	TTC5	Downregulated	Downregulated	Upregulated
10	PCOLCE2	Downregulated	Downregulated	Upregulated

Showing 1 to 10 of 28 entries

Previous1 2 3Next

6.1.3 Enrichment analysis

library(enrichR)
setEnrichrSite("Enrichr") # Human genes
websiteLive <- TRUE


dbs <- c("KEGG_2021_Human","MSigDB_Hallmark_2020")
if (is.null(dbs)) websiteLive <- FALSE
if (websiteLive) {
    enriched <- enrichr(c(S1.Positive.cor$Gene), dbs)
}

## Uploading data to Enrichr... Done.
##   Querying KEGG_2021_Human... Done.
##   Querying MSigDB_Hallmark_2020... Done.
## Parsing results... Done.

s1.kegg.pos<-as.data.frame(if (websiteLive) enriched[["KEGG_2021_Human"]])
create_dt(s1.kegg.pos)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Proteoglycans in cancer	3/205	0.00287802847588397	0.0921199654936703	11.7445544554455	68.7132748967338	PLAU;MYC;AKT3
2	Endometrial cancer	2/58	0.0029764701916058	0.0921199654936703	27.3571428571429	159.136969995712	MYC;AKT3
3	Acute myeloid leukemia	2/67	0.00395042124240719	0.0921199654936703	23.5585798816568	130.371604103407	MYC;AKT3
4	Central carbon metabolism in cancer	2/70	0.00430375556415394	0.0921199654936703	22.5158371040724	122.672297910598	MYC;AKT3
5	Salmonella infection	3/249	0.00496294101252886	0.0921199654936703	9.62243902439024	51.0543209773059	MYC;AKT3;IL18
6	Chronic myeloid leukemia	2/76	0.00505274789467576	0.0921199654936703	20.6839916839917	109.373287912458	MYC;AKT3
7	ErbB signaling pathway	2/85	0.00628031246106122	0.0921199654936703	18.4328081556997	93.4605223822077	MYC;AKT3
8	Colorectal cancer	2/86	0.00642430478069536	0.0921199654936703	18.2124542124542	91.9304015564488	MYC;AKT3
9	Small cell lung cancer	2/92	0.00731969302231779	0.0921199654936703	16.9931623931624	83.5585553177199	MYC;AKT3
10	MAPK signaling pathway	3/294	0.0078484280155866	0.0921199654936703	8.11587628865979	39.3412397510357	MYC;AKT3;EPHA2

Showing 1 to 10 of 125 entries

Previous1 2 3 4 5…13Next

colnames(s1.kegg.pos)

## [1] "Term"                 "Overlap"              "P.value"             
## [4] "Adjusted.P.value"     "Old.P.value"          "Old.Adjusted.P.value"
## [7] "Odds.Ratio"           "Combined.Score"       "Genes"

en.kegg.pos<-s1.kegg.pos %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1.8,
        legend.key.size= unit(.5, "cm"),
        axis.text.y = element_text(size=9.5))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("Top 20 KEGG_2021_Human",subtitle = 'Positively regulated by PRMT1')
en.kegg.pos

Msig.pos<-as.data.frame(if (websiteLive) enriched[["MSigDB_Hallmark_2020"]])
create_dt(Msig.pos)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Fatty Acid Metabolism	3/158	0.00137075116802467	0.0119058807664232	15.3421935483871	101.14182138722	ALDH3A1;TP53INP2;PTS
2	Pancreas Beta Cells	2/40	0.00142651862327447	0.0119058807664232	40.3522267206478	264.408705331075	AKT3;INSM1
3	Xenobiotic Metabolism	3/200	0.00268404671419375	0.0119058807664232	12.0456852791878	71.3156323456997	ALDH3A1;PTS;EPHA2
4	TNF-alpha Signaling via NF-kB	3/200	0.00268404671419375	0.0119058807664232	12.0456852791878	71.3156323456997	PLAU;MYC;IL18
5	Myc Targets V2	2/58	0.0029764701916058	0.0119058807664232	27.3571428571429	159.136969995712	MYC;TFB2M
6	UV Response Dn	2/144	0.0172165541933967	0.0573885139779891	10.7421451787649	43.6333466059315	MYC;AKT3
7	Inflammatory Response	2/200	0.0317180982356203	0.0906231378160579	7.68220668220668	26.5102799702858	MYC;IL18
8	Wnt-beta Catenin Signaling	1/42	0.0572002447510628	0.143000611877657	18.0045167118338	51.5144710341427	MYC
9	Coagulation	1/138	0.17634256298463	0.245424449319578	5.36226007028927	9.30527358223505	PLAU
10	Apoptosis	1/161	0.202652843923168	0.245424449319578	4.58611111111111	7.32062981457691	IL18

Showing 1 to 10 of 20 entries

Previous1 2Next

s1.en.Msig.pos<-Msig.pos %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("MSigDB_Hallmark_2020",subtitle = 'Positively regulated by PRMT1')
s1.en.Msig.pos

6.2 Negatively regulated by PRMT1

6.2.1 Make venn only negative

# We can make venn again only negative
neg.SH<-SH.regulated %>% 
  filter(grupSH=='Upregulated')
neg.SI<-SI.regulated %>% 
  filter(grupSI=='Upregulated')
neg.REC<-REC.regulated %>% 
  filter(grupREC=='Downregulated')

s1.list.neg<-list('Group SH'=as.character(neg.SH$Gene),
                   'Group SI'=as.character(neg.SI$Gene),
                   'Group Recovery'=as.character(neg.REC$Gene))

v1neg<-ggvenn(s1.list.neg,fill_color = c("#386cb0","#fdb462","gray"),fill_alpha = .3,text_size = 5,show_percentage = F)+
  ggtitle("Overlap DEGs",subtitle = "Negatively regulated by PRMT1")
v1neg

6.2.2 Datatable overlap negative

S1.Negative.cor<-(overlap %>% filter(grupSH == 'Upregulated' & grupSI == 'Upregulated' & grupREC == 'Downregulated'))
create_dt(S1.Negative.cor)

Show entries

Search:

	Gene	grupSH	grupSI	grupREC
1	FN1	Upregulated	Upregulated	Downregulated
2	SLC16A3	Upregulated	Upregulated	Downregulated
3	NME9	Upregulated	Upregulated	Downregulated
4	CXCR4	Upregulated	Upregulated	Downregulated
5	IL18R1	Upregulated	Upregulated	Downregulated
6	EVI5L	Upregulated	Upregulated	Downregulated
7	CDC14A	Upregulated	Upregulated	Downregulated
8	GCNT7	Upregulated	Upregulated	Downregulated
9	KLB	Upregulated	Upregulated	Downregulated
10	FALEC	Upregulated	Upregulated	Downregulated

Showing 1 to 10 of 14 entries

Previous1 2Next

6.2.3 Enrichment analysis

library(enrichR)
setEnrichrSite("Enrichr") # Human genes
websiteLive <- TRUE


dbs <- c("KEGG_2021_Human","MSigDB_Hallmark_2020")
if (is.null(dbs)) websiteLive <- FALSE
if (websiteLive) {
    enriched <- enrichr(c(S1.Negative.cor$Gene), dbs)
}

## Uploading data to Enrichr... Done.
##   Querying KEGG_2021_Human... Done.
##   Querying MSigDB_Hallmark_2020... Done.
## Parsing results... Done.

kegg.neg<-as.data.frame(if (websiteLive) enriched[["KEGG_2021_Human"]])
create_dt(kegg.neg)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Viral protein interaction with cytokine and cytokine receptor	2/100	0.00216576516004231	0.0649729548012694	33.8231292517007	207.504274169846	CXCR4;IL18R1
2	Regulation of actin cytoskeleton	2/218	0.00987264759485803	0.135765134196321	15.2546296296296	70.4456845963776	FN1;CXCR4
3	Cytokine-cytokine receptor interaction	2/295	0.0175531243024159	0.135765134196321	11.2019340159272	45.2840795107203	CXCR4;IL18R1
4	Intestinal immune network for IgA production	1/48	0.0330912315021827	0.135765134196321	32.633387888707	111.23047645903	CXCR4
5	Inflammatory bowel disease	1/65	0.044565151918294	0.135765134196321	23.9447115384615	74.4872822237409	IL18R1
6	Central carbon metabolism in cancer	1/70	0.0479156957277768	0.135765134196321	22.2040133779264	67.462723652684	SLC16A3
7	Adherens junction	1/71	0.0485844938901796	0.135765134196321	21.8857142857143	66.1922672780771	PTPRB
8	Pathways in cancer	2/531	0.0518554572977387	0.135765134196321	6.13011972274732	18.1408332469128	FN1;CXCR4
9	Bacterial invasion of epithelial cells	1/77	0.0525881307391529	0.135765134196321	20.1518218623482	59.3524523134869	FN1
10	Complement and coagulation cascades	1/85	0.0579019808424563	0.135765134196321	18.2252747252747	51.9238748259637	CFI

Showing 1 to 10 of 30 entries

Previous1 2 3Next

en.kegg.neg<-kegg.neg %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1.65,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("KEGG_2021_Human",subtitle = 'Negatively regulated by PRMT1')
en.kegg.neg

Msig.neg<-as.data.frame(if (websiteLive) enriched[["MSigDB_Hallmark_2020"]])
create_dt(Msig.neg)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Coagulation	2/138	0.00407365385483485	0.0448101924031833	24.3259803921569	133.871098462424	CFI;FN1
2	Glycolysis	2/200	0.00836602708818224	0.0460131489850023	16.6565656565657	79.6779505167745	CXCR4;SLC16A3
3	IL-6/JAK/STAT3 Signaling	1/87	0.0592261122301626	0.131293774378851	17.7996422182469	50.3087797070793	IL18R1
4	PI3K/AKT/mTOR Signaling	1/105	0.0710657711124452	0.131293774378851	14.7056213017751	38.8838608747136	CXCR4
5	IL-2/STAT5 Signaling	1/199	0.13067913499845	0.131293774378851	7.68764568764569	15.6444382455603	IL18R1
6	KRAS Signaling Up	1/200	0.131293774378851	0.131293774378851	7.64862775415539	15.5291459470743	CXCR4
7	Hypoxia	1/200	0.131293774378851	0.131293774378851	7.64862775415539	15.5291459470743	CXCR4
8	Complement	1/200	0.131293774378851	0.131293774378851	7.64862775415539	15.5291459470743	FN1
9	mTORC1 Signaling	1/200	0.131293774378851	0.131293774378851	7.64862775415539	15.5291459470743	CXCR4
10	Epithelial Mesenchymal Transition	1/200	0.131293774378851	0.131293774378851	7.64862775415539	15.5291459470743	FN1

Showing 1 to 10 of 11 entries

Previous1 2Next

en.Msig.neg<-Msig.neg %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = .5,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("MSigDB_Hallmark_2020",subtitle = 'Negatively regulated by PRMT1')
en.Msig.neg

7 Scenario 2

Scenario 2 consider knockdown and overexpression by analyzing separately

7.1 Knockdown

7.1.1 Compare using venn diagram

library(gridExtra)
grid.arrange(v1pos,v1neg,ncol=2)

s2.list.pos<-list('Group SH'=as.character(pos.SH$Gene),
                   'Group SI'=as.character(pos.SI$Gene))

v2pos<-ggvenn(s2.list.pos,fill_color = c("#386cb0","#fdb462"),fill_alpha = .3,text_size = 5,show_percentage = F)+
  ggtitle("Overlap DEGs",subtitle = "Positively regulated by PRMT1")

s2.list.neg<-list('Group SH'=as.character(neg.SH$Gene),
                   'Group SI'=as.character(neg.SI$Gene))

v2neg<-ggvenn(s2.list.neg,fill_color = c("#386cb0","#fdb462"),fill_alpha = .3,text_size = 5,show_percentage = F)+
  ggtitle("Overlap DEGs",subtitle = "Negatively regulated by PRMT1")

# Venn only knockdown
grid.arrange(v2pos,v2neg,ncol=2)

7.1.2 Datatable overlap

overlap<-as.data.frame(intersect(x=as.character(SH.regulated$Gene),y=as.character(SI.regulated$Gene)))
colnames(overlap)[1]<-"Gene"

overlap<-overlap %>% 
  left_join(fc) %>% 
  select(Gene,grupSH,grupSI)

S2.Positive.cor<-(overlap %>% filter(grupSH == 'Downregulated' & grupSI == 'Downregulated'))
create_dt(S2.Positive.cor)

Show entries

Search:

	Gene	grupSH	grupSI
1	LOC101929057	Downregulated	Downregulated
2	C14orf1	Downregulated	Downregulated
3	ST20	Downregulated	Downregulated
4	PPP1R14C	Downregulated	Downregulated
5	WFDC1	Downregulated	Downregulated
6	NKX3-2	Downregulated	Downregulated
7	NDP	Downregulated	Downregulated
8	SLC16A7	Downregulated	Downregulated
9	KLF7	Downregulated	Downregulated
10	RBM42	Downregulated	Downregulated

Showing 1 to 10 of 116 entries

Previous1 2 3 4 5…12Next

S2.Negative.cor<-(overlap %>% filter(grupSH == 'Upregulated' & grupSI == 'Upregulated'))
create_dt(S2.Negative.cor)

Show entries

Search:

	Gene	grupSH	grupSI
1	IFI27	Upregulated	Upregulated
2	SUCNR1	Upregulated	Upregulated
3	FN1	Upregulated	Upregulated
4	SYTL2	Upregulated	Upregulated
5	LGALS9	Upregulated	Upregulated
6	CDH17	Upregulated	Upregulated
7	TOX3	Upregulated	Upregulated
8	APOL1	Upregulated	Upregulated
9	PGM2L1	Upregulated	Upregulated
10	HPGD	Upregulated	Upregulated

Showing 1 to 10 of 566 entries

Previous1 2 3 4 5…57Next

7.1.3 Enrichment analysis (Positive)

library(enrichR)
setEnrichrSite("Enrichr") # Human genes
websiteLive <- TRUE


dbs <- c("KEGG_2021_Human","MSigDB_Hallmark_2020")
if (is.null(dbs)) websiteLive <- FALSE
if (websiteLive) {
    enriched <- enrichr(c(S2.Positive.cor$Gene), dbs)
}

## Uploading data to Enrichr... Done.
##   Querying KEGG_2021_Human... Done.
##   Querying MSigDB_Hallmark_2020... Done.
## Parsing results... Done.

kegg.pos<-as.data.frame(if (websiteLive) enriched[["KEGG_2021_Human"]])
create_dt(kegg.pos)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Salmonella infection	6/249	0.00332933052052366	0.221061512954631	4.40875420875421	25.1518723976215	TUBB2B;TUBB3;MYC;AKT3;IL18;PFN1
2	Phenylalanine metabolism	2/17	0.00428471834240608	0.221061512954631	23.2385964912281	126.713105781034	AOC3;ALDH3A1
3	Steroid biosynthesis	2/20	0.00591850434017845	0.221061512954631	19.3625730994152	99.3236395350484	MSMO1;FDFT1
4	Proteoglycans in cancer	5/205	0.00690141815533305	0.221061512954631	4.43333333333333	22.0603923904089	WNT11;PLAU;MYC;CAV1;AKT3
5	MAPK signaling pathway	6/294	0.00739017208325469	0.221061512954631	3.71136363636364	18.2139039860358	MAPK7;MYC;AKT3;EPHA2;DUSP7;HSPA1A
6	Central carbon metabolism in cancer	3/70	0.00784833773803423	0.221061512954631	7.8524633469819	38.0644511134147	SLC7A5;MYC;AKT3
7	mTOR signaling pathway	4/154	0.0124403886946122	0.274099963983033	4.69857142857143	20.6117257820081	SLC7A5;WNT11;AKT3;SLC3A2
8	beta-Alanine metabolism	2/30	0.0130490355426018	0.274099963983033	12.4411027568922	53.982455603338	AOC3;ALDH3A1
9	Gap junction	3/88	0.014597039502055	0.274099963983033	6.18396668401874	26.1392347676454	TUBB2B;MAPK7;TUBB3
10	Tyrosine metabolism	2/36	0.0184775209526285	0.312270104099422	10.2425180598555	40.8799418635922	AOC3;ALDH3A1

Showing 1 to 10 of 169 entries

Previous1 2 3 4 5…17Next

en.kegg.pos<-kegg.pos %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1.65,
        legend.key.size= unit(.5, "cm"),
        axis.text.y = element_text(size=10))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("KEGG_2021_Human",subtitle = 'Positively regulated by PRMT1')
en.kegg.pos

Msig.pos<-as.data.frame(if (websiteLive) enriched[["MSigDB_Hallmark_2020"]])
create_dt(Msig.pos)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Cholesterol Homeostasis	4/74	0.000904183857279816	0.0316464350047936	10.1091836734694	70.8499897186436	IDI1;ACSS2;TRIB3;FDFT1
2	Fatty Acid Metabolism	5/158	0.00229062937054879	0.0400860139846039	5.8090443384561	35.312766144572	AOC3;ALDH3A1;IDI1;TP53INP2;PTS
3	Estrogen Response Late	5/200	0.00623218277073866	0.072708798991951	4.54816354816355	23.0957047709029	SLC7A5;CAV1;AGR2;MEST;FDFT1
4	Pancreas Beta Cells	2/40	0.0225366161318978	0.0929696169130663	9.16251154201293	34.7498687145642	AKT3;INSM1
5	Wnt-beta Catenin Signaling	2/42	0.0246914866908945	0.0929696169130663	8.70350877192982	32.2142688455466	MYC;DKK1
6	Unfolded Protein Response	3/113	0.0280824521542751	0.0929696169130663	4.77248592115849	17.0502327222274	SLC7A5;PSAT1;HERPUD1
7	Estrogen Response Early	4/200	0.0292190224583923	0.0929696169130663	3.58746355685131	12.6742767370424	SLC7A5;TUBB2B;MYC;FDFT1
8	mTORC1 Signaling	4/200	0.0292190224583923	0.0929696169130663	3.58746355685131	12.6742767370424	IDI1;SLC7A5;PSAT1;TRIB3
9	Myc Targets V1	4/200	0.0292190224583923	0.0929696169130663	3.58746355685131	12.6742767370424	MYC;C1QBP;SRSF1;EIF4H
10	Epithelial Mesenchymal Transition	4/200	0.0292190224583923	0.0929696169130663	3.58746355685131	12.6742767370424	NT5E;PCOLCE2;DKK1;MEST

Showing 1 to 10 of 35 entries

Previous1 2 3 4Next

en.Msig.pos<-Msig.pos %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1.7,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("MSigDB_Hallmark_2020",subtitle = 'Positively regulated by PRMT1')
en.Msig.pos

7.1.4 Enrichment analysis (negative)

library(enrichR)
setEnrichrSite("Enrichr") # Human genes
websiteLive <- TRUE


dbs <- c("KEGG_2021_Human","MSigDB_Hallmark_2020")
if (is.null(dbs)) websiteLive <- FALSE
if (websiteLive) {
    enriched <- enrichr(c(S2.Negative.cor$Gene), dbs)
}

## Uploading data to Enrichr... Done.
##   Querying KEGG_2021_Human... Done.
##   Querying MSigDB_Hallmark_2020... Done.
## Parsing results... Done.

kegg.neg<-as.data.frame(if (websiteLive) enriched[["KEGG_2021_Human"]])
create_dt(kegg.neg)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Herpes simplex virus 1 infection	26/498	0.00215289101846366	0.525305408505132	1.93429064657878	11.8783699220436	ZNF791;ZNF350;ZNF44;PIK3R1;C5;ZNF766;ZNF700;ZNF248;ZNF600;ZNF566;ZNF841;ZNF564;ZNF420;ZNF440;DDX58;ZNF182;ZNF33B;TAPBP;ZNF33A;BST2;OAS2;ZNF814;ZNF432;IFNAR1;ZNF431;BIRC3
2	Proteoglycans in cancer	13/205	0.00575381566645581	0.531127200875597	2.3559561482821	12.1517674875799	ROCK2;FZD6;FN1;ITPR2;FRS2;ANK3;PIK3R1;WNT16;HIF1A;RPS6KB1;MDM2;PPP1R12B;PRKACB
3	Human papillomavirus infection	18/331	0.00653025246978192	0.531127200875597	2.00658799934703	10.0957656116053	MAML2;FZD6;MX1;FN1;PIK3R1;TUBG2;WNT16;CDK6;RBL1;TERT;APC;RPS6KB1;MDM2;ATM;ITGB6;PRKACB;ATR;IFNAR1
4	Pathways in cancer	24/531	0.0169763342397138	0.782724865859274	1.65304919321383	6.73772107714252	ROCK2;NCOA3;FZD6;FN1;CXCR4;PIK3R1;PLD1;WNT16;HIF1A;GNA13;BMP2;CDK6;TERT;MSH2;APC;RPS6KB1;LPAR6;GSTA1;MDM2;POLK;IL6ST;PRKACB;IFNAR1;BIRC3
5	Hepatocellular carcinoma	10/168	0.0215025792386926	0.782724865859274	2.19424460431655	8.4249829343041	CDK6;TERT;APC;RPS6KB1;FZD6;GSTA1;PIK3R1;POLK;ARID2;WNT16
6	Cell cycle	8/124	0.0247675251512827	0.782724865859274	2.38759115066123	8.82984200964942	CDK6;STAG2;RBL1;MDM2;ATM;SMC3;CDC14A;ATR
7	Mineral absorption	5/60	0.027197541353171	0.782724865859274	3.1403338194782	11.319737417019	ATP2B4;TRPM7;ATP2B1;SLC26A9;MT1E
8	Basal cell carcinoma	5/63	0.0327018143558234	0.782724865859274	2.97744176040322	10.1838176487104	BMP2;APC;FZD6;POLK;WNT16
9	NOD-like receptor signaling pathway	10/181	0.0336072172228981	0.782724865859274	2.02606335983844	6.87446222975937	IFI16;OAS2;NEK7;ITPR2;TNFAIP3;TRPM7;BRCC3;DNM1L;IFNAR1;BIRC3
10	Hepatitis C	9/157	0.0348380426176801	0.782724865859274	2.10556067737396	7.06846259819873	CDK6;RSAD2;DDX58;OAS2;MX1;CLDN18;PIK3R1;IFIT1;IFNAR1

Showing 1 to 10 of 244 entries

Previous1 2 3 4 5…25Next

en.kegg.neg<-kegg.neg %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1.65,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("KEGG_2021_Human",subtitle = 'Negatively regulated by PRMT1')
en.kegg.neg

Msig.neg<-as.data.frame(if (websiteLive) enriched[["MSigDB_Hallmark_2020"]])
create_dt(Msig.neg)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Interferon Gamma Response	19/200	0.00000437075169204439	0.000192313074449953	3.69475895643742	45.5954520473828	RSAD2;DDX58;NCOA3;MX1;ARID5B;TNFAIP3;PLA2G4A;IFIT1;PARP14;HIF1A;IFIT3;TAPBP;BST2;IFI27;OAS2;XAF1;CFB;GPR18;HERC6
2	Mitotic Spindle	17/199	0.000054168775935425	0.00119171307057935	3.27552593126364	32.1768207760548	TOP2A;DST;ARHGAP29;HOOK3;SMC3;PKD2;CD2AP;KIF15;FGD4;PCM1;CLIP1;FGD6;APC;KIF5B;RASA1;ALMS1;NF1
3	Interferon Alpha Response	8/97	0.00625008675694134	0.0916679391018064	3.11626595787524	15.8155481337807	BST2;RSAD2;IFI27;LPAR6;MX1;PARP14;IFIT3;HERC6
4	Inflammatory Response	12/200	0.011800098693232	0.129801085625552	2.21745141715954	9.8447023827014	BST2;GABBR1;KLF6;TNFSF15;GPR183;PTAFR;ATP2B1;SLC28A2;HIF1A;IL18R1;IFNAR1;TAPBP
5	Androgen Response	7/100	0.0234420725603312	0.206290238530915	2.60424721565007	9.77432028280137	INPP4B;LMAN1;CDK6;HPGD;ZBTB10;ARID5B;IQGAP2
6	UV Response Dn	8/144	0.0524526273916399	0.287581037616801	2.03436643474594	5.99699662201502	INPP4B;NEK7;ATRX;ATP2B4;ATP2B1;ADD3;RND3;MT1E
7	TNF-alpha Signaling via NF-kB	10/200	0.058823394057982	0.287581037616801	1.82165846270352	5.16115125651156	EFNA1;BMP2;KLF6;DDX58;GPR183;ZBTB10;TNFAIP3;ATP2B1;IL6ST;BIRC3
8	G2-M Checkpoint	10/200	0.058823394057982	0.287581037616801	1.82165846270352	5.16115125651156	TOP2A;SLC12A2;POLQ;WRN;RBL1;KIF5B;ATRX;PDS5B;HIF1A;KIF15
9	KRAS Signaling Up	10/200	0.058823394057982	0.287581037616801	1.82165846270352	5.16115125651156	RBM4;BMP2;ACE;NR1H4;CXCR4;TNFAIP3;CFB;CTSS;MPZL2;BIRC3
10	Hedgehog Signaling	3/36	0.0809520021501572	0.356188809460692	3.13273050217988	7.87536765689415	CDK6;RASA1;NF1

Showing 1 to 10 of 44 entries

Previous1 2 3 4 5Next

en.Msig.neg<-Msig.neg %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = .5,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("MSigDB_Hallmark_2020",subtitle = 'Negatively regulated by PRMT1')
en.Msig.neg

7.2 Recovery

Since there is no replicate in recovery, instead of making venn diagram, we can directly assign positive and negative DEGs

7.2.1 Datatable

s2.REC.pos<-REC.regulated %>% 
  filter(grupREC=='Upregulated') %>% 
  select(Gene,grupREC)
create_dt(s2.REC.pos)

Show entries

Search:

	Gene	grupREC
1	IFI27	Upregulated
2	SUCNR1	Upregulated
3	SYTL2	Upregulated
4	LGALS9	Upregulated
5	APOL1	Upregulated
6	IFI6	Upregulated
7	PHGR1	Upregulated
8	BST2	Upregulated
9	PARP14	Upregulated
10	LOC286437	Upregulated

Showing 1 to 10 of 1,134 entries

Previous1 2 3 4 5…114Next

s2.REC.neg<-REC.regulated %>% 
  filter(grupREC=='Downregulated') %>% 
  select(Gene,grupREC)
create_dt(s2.REC.neg)

Show entries

Search:

	Gene	grupREC
1	FN1	Downregulated
2	CD70	Downregulated
3	SLC16A3	Downregulated
4	GP2	Downregulated
5	INPP5D	Downregulated
6	NME9	Downregulated
7	CXCR4	Downregulated
8	SNORA23	Downregulated
9	CEACAM3	Downregulated
10	IL18R1	Downregulated

Showing 1 to 10 of 293 entries

Previous1 2 3 4 5…30Next

7.2.2 Enrichment (Positive)

setEnrichrSite("Enrichr") # Human genes
websiteLive <- TRUE
dbs <- c("KEGG_2021_Human","MSigDB_Hallmark_2020")
if (is.null(dbs)) websiteLive <- FALSE
if (websiteLive) {
    enriched <- enrichr(c(s2.REC.pos$Gene), dbs)
}

## Uploading data to Enrichr... Done.
##   Querying KEGG_2021_Human... Done.
##   Querying MSigDB_Hallmark_2020... Done.
## Parsing results... Done.

kegg.pos<-as.data.frame(if (websiteLive) enriched[["KEGG_2021_Human"]])
create_dt(kegg.pos)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Herpes simplex virus 1 infection	59/498	6.64769657403195e-8	0.0000185103961866965	2.30374106054988	38.0725700587188	ZNF251;ZNF250;IFIH1;CASP9;TBK1;CASP8;ZNF84;AKT3;AKT1;JAK2;B2M;ZNF684;ZNF680;ZNF283;IFNGR1;DDX58;TAP2;HLA-B;TAP1;HLA-C;HCFC2;HLA-F;ZNF14;ZNF718;OAS1;OAS2;OAS3;ZNF714;ZNF558;ZNF436;ZNF235;ZNF674;TLR3;IRF9;ZNF552;BIRC3;ZNF550;SP100;ZNF273;CCL5;ZNF506;ZNF227;ZNF425;ZNF468;ZNF302;ZNF300;ZNF585A;ZNF782;STAT1;STAT2;ZNF180;EIF2AK2;POU2F3;PML;BST2;ZNF816;BCL2;MYD88;ZNF850
2	Influenza A	29/172	1.24649132570347e-7	0.0000185103961866965	3.43617378097016	54.6274763483074	CXCL8;ADAR;CASP9;IFIH1;TBK1;CASP8;CCL5;AKT3;TNFSF10;AKT1;JAK2;RSAD2;DDX58;IFNGR1;STAT1;MX2;STAT2;MX1;IL18;EIF2AK2;PML;CXCL10;OAS1;OAS2;OAS3;RAF1;MYD88;IRF9;TLR3
3	Hepatitis C	26/157	7.88252955998113e-7	0.0000780370426438132	3.3559539228925	47.1627198798643	RB1;IFIT1;CASP9;CLDN22;NRAS;TBK1;CASP8;MYC;AKT3;CLDN23;AKT1;RSAD2;DDX58;STAT1;MX2;STAT2;MX1;EIF2AK2;CXCL10;OAS1;OAS2;OAS3;CLDN18;RAF1;IRF9;TLR3
4	Epstein-Barr virus infection	29/202	0.00000379059620890924	0.000267901109910988	2.83575445295949	35.3986866525887	RB1;CD40;CASP9;TBK1;CASP8;MYC;AKT3;PLCG2;BLNK;AKT1;B2M;STAT1;DDX58;STAT2;HLA-B;TAP2;HLA-C;EIF2AK2;TAP1;ISG15;HLA-F;CXCL10;CCNE2;OAS1;OAS2;OAS3;BCL2;MYD88;IRF9
5	Kaposi sarcoma-associated herpesvirus infection	28/193	0.00000451011969547118	0.000267901109910988	2.86935174530111	35.3193868137115	RB1;CXCL8;FGF2;CASP9;NRAS;ZFP36;TBK1;CASP8;MYC;AKT3;PLCG2;AKT1;JAK2;CCR1;IFNGR1;STAT1;STAT2;HLA-B;HLA-C;EIF2AK2;FOS;HLA-F;NFATC4;VEGFA;GNB2;RAF1;TLR3;IRF9
6	Measles	22/139	0.0000115246888300929	0.0005704720970896	3.17037139519154	36.0503532735111	DDX58;STAT1;MX2;STAT2;MX1;EIF2AK2;ADAR;FOS;CASP9;IFIH1;TBK1;CASP8;CCNE2;OAS1;OAS2;OAS3;AKT3;BCL2;AKT1;RAB9A;MYD88;IRF9
7	Hepatitis B	23/162	0.000044239892444813	0.00187703543658707	2.78911991918616	27.9633917452536	RB1;CXCL8;DDX58;STAT1;STAT2;FOS;NFATC4;CASP9;IFIH1;NRAS;TBK1;CASP8;CREB3L3;CCNE2;MYC;AKT3;BCL2;STAT4;AKT1;RAF1;JAK2;MYD88;TLR3
8	Human immunodeficiency virus 1 infection	27/212	0.000070480122839376	0.00212548850825043	2.46288727752142	23.5456452825986	SAMHD1;GNAI1;CCNB3;CASP9;NRAS;TBK1;CASP8;TRIM5;AKT3;AP1S2;PLCG2;AKT1;B2M;APOBEC3F;HLA-B;TAP2;HLA-C;TAP1;FOS;HLA-F;NFATC4;BST2;APOBEC3A_B;GNB2;BCL2;RAF1;MYD88
9	Toll-like receptor signaling pathway	17/104	0.0000731709239038992	0.00212548850825043	3.28510274853621	31.2830887784139	CD40;CXCL9;CXCL8;CCL4L1;STAT1;CCL4L2;FOS;CXCL10;CXCL11;TBK1;CASP8;CCL5;AKT3;AKT1;TLR6;MYD88;TLR3
10	Bladder cancer	10/41	0.0000737090849331097	0.00212548850825043	5.40552175410401	51.4356178986031	RB1;NRAS;CXCL8;RPS6KA5;DAPK1;MMP1;MYC;RAF1;TYMP;VEGFA

Showing 1 to 10 of 297 entries

Previous1 2 3 4 5…30Next

en.kegg.pos<-kegg.pos %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1.9,
        legend.key.size= unit(.5, "cm"),
        axis.text.y=element_text(size = 10))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("KEGG_2021_Human",subtitle = 'Positively regulated by PRMT1')
en.kegg.pos

Msig.pos<-as.data.frame(if (websiteLive) enriched[["MSigDB_Hallmark_2020"]])
create_dt(Msig.pos)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Interferon Alpha Response	57/97	7.60057058433622e-46	3.72427958632475e-44	24.9090529247911	2587.81871942523	IFITM3;RTP4;IFITM1;SAMD9L;UBE2L6;ADAR;IFI35;IFIT3;IFI44L;IFIT2;OASL;IFIH1;CASP8;TRIM5;LAMP3;DHX58;EPSTI1;TRIM21;B2M;HERC6;BATF2;RSAD2;SP110;TAP1;HLA-C;PARP9;PROCR;PLSCR1;IFI27;OAS1;IRF1;CMPK2;TRIM14;TXNIP;NCOA7;IRF9;UBA7;SAMD9;DDX60;USP18;HELZ2;GBP4;PNPT1;STAT2;MX1;IFI44;EIF2AK2;ISG15;TDRD7;NMI;PARP14;PSMB8;PSMB9;BST2;ISG20;CXCL10;CXCL11
2	Interferon Gamma Response	76/200	5.66109885362903e-43	1.38696921913911e-41	10.8573083724617	1056.17226015225	IFITM3;RTP4;CD40;SAMD9L;CXCL9;TNFAIP2;SECTM1;UBE2L6;ADAR;IFI35;IFIT1;IFIT3;IFI44L;IFIT2;OASL;IFIH1;MT2A;CASP8;DHX58;TNFSF10;EPSTI1;PIM1;JAK2;TRIM21;B2M;HERC6;GBP6;IL15RA;BATF2;RSAD2;SP110;DDX58;HLA-B;TAP1;PLSCR1;IFI27;OAS2;IRF1;OAS3;TRIM14;TXNIP;CMPK2;IRF8;CFB;IRF9;NLRC5;DDX60;SAMHD1;USP18;HELZ2;APOL6;CCL5;STAT4;ST3GAL5;GBP4;PNPT1;STAT1;STAT2;MX2;MX1;LYSMD2;EIF2AK2;IFI44;ISG15;TDRD7;NMI;PARP14;PSMB8;PML;PSMB9;BST2;ISG20;CXCL10;CXCL11;XAF1;MYD88
3	TNF-alpha Signaling via NF-kB	35/200	2.32406996984754e-9	3.79598095075098e-8	3.6095348388342	71.7573572873511	PPP1R15A;CEBPB;TNFAIP2;IFIT2;IFIH1;ZFP36;PLAU;MYC;CCL5;DNAJB4;KLF10;IL15RA;EGR1;DUSP5;TIPARP;DUSP1;DDX58;TNFRSF9;LIF;IL18;PLAUR;G0S2;TAP1;FOS;INHBA;KLF4;F3;KLF2;VEGFA;CXCL10;CXCL11;IRF1;SIK1;ATF3;BIRC3
4	KRAS Signaling Up	31/200	3.26239493676761e-7	0.00000399643379754032	3.10936284581588	46.440305693638	PPP1R15A;FLT4;USP12;GLRX;TFPI;CTSS;GPNMB;PLAU;CA2;TSPAN7;CBX8;GALNT3;TMEM176B;TMEM176A;IGF2;LIF;PLAUR;G0S2;INHBA;KLF4;PSMB8;EREG;BTC;CXCL10;RBP4;TNNT2;IRF8;ADAM8;ANGPTL4;CFB;BIRC3
5	Inflammatory Response	30/200	0.00000102479516460323	0.0000100429926131116	2.98849104859335	41.2143332605047	RTP4;IFITM1;CD40;CXCL9;CXCL8;C5AR1;NOD2;MYC;LAMP3;CCL5;TNFSF10;ITGB8;IL15RA;CCL22;TNFRSF9;TPBG;LIF;IL18;PLAUR;EIF2AK2;NMI;INHBA;F3;EREG;BST2;CXCL10;CXCL11;IRF1;RAF1;TLR3
6	Complement	25/200	0.000173336468387277	0.0014155811584961	2.40770320752286	20.8513741789255	CEBPB;CTSV;CTSS;PHEX;CASP9;VCPIP1;PPP4C;CTSL;CA2;CCL5;PIM1;JAK2;DUSP5;APOBEC3F;ERAP2;PLAUR;F3;PSMB9;PLSCR1;MMP13;GNB2;IRF1;RAF1;CFB;LGMN
7	IL-6/JAK/STAT3 Signaling	14/87	0.000365022758595315	0.0025551593101672	3.21797945205479	25.4720799998979	CCR1;IL15RA;CXCL9;IFNGR1;STAT1;STAT2;CXCL10;CXCL11;IRF1;PIM1;CD9;LTB;IRF9;MYD88
8	Allograft Rejection	24/200	0.000426613972980356	0.00261301058450468	2.2960687960688	17.8166466039129	CCR1;ACHE;CD40;CXCL9;CCL22;IFNGR1;STAT1;LIF;IL18;TAP2;UBE2D1;TAP1;INHBA;CTSS;EREG;CCL5;STAT4;AKT1;IRF8;TLR6;LTB;JAK2;B2M;TLR3
9	Apoptosis	19/161	0.00196938892750887	0.0107222286053261	2.24692730373271	13.9984289442335	IFITM3;IFNGR1;IL18;TAP1;EREG;ISG20;CASP9;CASP8;IRF1;CTH;TNFSF10;TXNIP;PMAIP1;SC5D;BMF;IGFBP6;ATF3;BCL2L2;BIRC3
10	Hypoxia	22/200	0.00225900788423996	0.0110691386327758	2.07711583542155	12.6555127436465	PPP1R15A;TIPARP;CITED2;DUSP1;TPBG;PLAUR;GLRX;VLDLR;FOS;F3;VEGFA;SULT2B1;ISG20;MT2A;ZFP36;PPP1R3C;CCNG2;PIM1;BCL2;ANGPTL4;ATP7A;ATF3

Showing 1 to 10 of 49 entries

Previous1 2 3 4 5Next

en.Msig.pos<-Msig.pos %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1.65,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("MSigDB_Hallmark_2020",subtitle = 'Positively regulated by PRMT1')
en.Msig.pos

7.2.3 Enrichment (Negative)

setEnrichrSite("Enrichr") # Human genes
websiteLive <- TRUE
dbs <- c("KEGG_2021_Human","MSigDB_Hallmark_2020")
if (is.null(dbs)) websiteLive <- FALSE
if (websiteLive) {
    enriched <- enrichr(c(s2.REC.neg$Gene), dbs)
}

## Uploading data to Enrichr... Done.
##   Querying KEGG_2021_Human... Done.
##   Querying MSigDB_Hallmark_2020... Done.
## Parsing results... Done.

kegg.neg<-as.data.frame(if (websiteLive) enriched[["KEGG_2021_Human"]])
create_dt(kegg.neg)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Steroid biosynthesis	4/20	0.000179309410444292	0.0322756938799725	17.09375	147.457485588284	NSDHL;DHCR24;DHCR7;LSS
2	Terpenoid backbone biosynthesis	3/22	0.00386193628306859	0.347574265476173	10.7570570023675	59.7725187253069	MVK;PDSS2;MVD
3	Hippo signaling pathway	7/163	0.0101717592715864	0.610305556295182	3.07836257309942	14.1239587562563	TEAD4;WNT2B;ID2;FZD9;TEAD2;WNT4;NKD2
4	Other glycan degradation	2/18	0.0278630828490335	0.942119595443076	8.48793103448276	30.3906352649602	MAN2B2;MAN2B1
5	Arginine biosynthesis	2/22	0.0404977898755039	0.942119595443076	6.78896551724138	21.7688714099827	GLUD2;NOS3
6	Hedgehog signaling pathway	3/56	0.0484539379890358	0.942119595443076	3.84964418619834	11.65341830956	HHAT;EVC;DISP1
7	Insulin signaling pathway	5/137	0.0507283261142597	0.942119595443076	2.58367648611551	7.70263932650822	SOCS2;INPP5A;FASN;PYGL;SH2B2
8	Biosynthesis of unsaturated fatty acids	2/27	0.0586942674962446	0.942119595443076	5.42979310344828	15.3957071178538	HACD1;SCD
9	Viral protein interaction with cytokine and cytokine receptor	4/100	0.05889153575865	0.942119595443076	2.83738425925926	8.03563651794237	TNFRSF10C;CXCR4;IL18R1;TNFRSF10D
10	Calcium signaling pathway	7/240	0.0630196375332066	0.942119595443076	2.05293276108727	5.6749402908422	P2RX5;NOS3;CASQ2;CXCR4;GRIN2C;NTSR1;SLC25A6

Showing 1 to 10 of 180 entries

Previous1 2 3 4 5…18Next

en.kegg.neg<-kegg.neg %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1.65,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("KEGG_2021_Human",subtitle = 'Negatively regulated by PRMT1')
en.kegg.neg

Msig.neg<-as.data.frame(if (websiteLive) enriched[["MSigDB_Hallmark_2020"]])
create_dt(Msig.neg)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Cholesterol Homeostasis	7/74	0.000102662511001997	0.00410650044007989	7.20015710919089	66.1267004012575	NSDHL;MVK;SCD;FASN;MVD;DHCR7;LSS
2	Epithelial Mesenchymal Transition	7/200	0.0278876818557578	0.37183575807677	2.48350149986365	8.88986795608602	FBN2;NNMT;ID2;GPC1;FN1;HTRA1;COLGALT1
3	Glycolysis	7/200	0.0278876818557578	0.37183575807677	2.48350149986365	8.88986795608602	NSDHL;CHPF;GPC1;CXCR4;PYGL;SLC16A3;B4GALT7
4	Coagulation	5/138	0.0520364222278305	0.471560390627697	2.56411935762752	7.57905317215178	MMP15;CFI;HTRA1;FN1;SH2B2
5	IL-2/STAT5 Signaling	6/199	0.0722394004701046	0.471560390627697	2.12127250987355	5.57421556123134	SOCS2;IL3RA;COL6A1;EMP1;ETV4;IL18R1
6	Bile Acid Metabolism	4/112	0.0817611002881478	0.471560390627697	2.52057613168724	6.31140591867185	LCK;FDXR;DHCR24;MLYCD
7	Estrogen Response Early	5/200	0.169268950850924	0.471560390627697	1.74332171893148	3.09660380049367	CYP26B1;FASN;DHCR7;CBFA2T3;PAPSS2
8	Estrogen Response Late	5/200	0.169268950850924	0.471560390627697	1.74332171893148	3.09660380049367	CYP26B1;GJB3;ID2;DHCR7;PAPSS2
9	Myogenesis	5/200	0.169268950850924	0.471560390627697	1.74332171893148	3.09660380049367	TEAD4;ITGB4;SCD;CASQ2;SOD3
10	Complement	5/200	0.169268950850924	0.471560390627697	1.74332171893148	3.09660380049367	CDA;MMP15;LCK;FN1;PCSK9

Showing 1 to 10 of 40 entries

Previous1 2 3 4Next

en.Msig.neg<-Msig.neg %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 0.7,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("MSigDB_Hallmark_2020",subtitle = 'Negatively regulated by PRMT1')
en.Msig.neg

8 Scenario 3

In this scenario, we simply excluded si PRMT group.

8.1 Make venn

pos.SH<-SH.regulated %>% 
  filter(grupSH=='Downregulated')
pos.REC<-REC.regulated %>% 
  filter(grupREC=='Upregulated')
neg.SH<-SH.regulated %>% 
  filter(grupSH=='Upregulated')
neg.REC<-REC.regulated %>% 
  filter(grupREC=='Downregulated')

s3.list.pos<-list('Group SH'=as.character(pos.SH$Gene),
                   'Group Recovery'=as.character(pos.REC$Gene))
s3.list.neg<-list('Group SH'=as.character(neg.SH$Gene),
                   'Group Recovery'=as.character(neg.REC$Gene))


v3pos<-ggvenn(s3.list.pos,fill_color = c("#386cb0","#fdb462"),fill_alpha = .3,text_size = 5,show_percentage = F,set_name_size = 5)+
  ggtitle("Overlap DEGs",subtitle = "Positively regulated by PRMT1")
v3neg<-ggvenn(s3.list.neg,fill_color = c("#386cb0","#fdb462"),fill_alpha = .3,text_size = 5,show_percentage = F,set_name_size = 5)+
  ggtitle("Overlap DEGs",subtitle = "Negatively regulated by PRMT1")


grid.arrange(v3pos,v3neg,ncol=2)

8.1.1 Datatable

overlap<-as.data.frame(intersect(x=as.character(SH.regulated$Gene),y=as.character(REC.regulated$Gene)))
colnames(overlap)[1]<-"Gene"

overlap<-overlap %>% 
  left_join(fc) %>% 
  select(Gene,grupSH,grupREC)

# Positive
S3.Positive.cor<-(overlap %>% filter(grupSH == 'Downregulated' & grupREC == 'Upregulated'))
create_dt(S3.Positive.cor)

Show entries

Search:

	Gene	grupSH	grupREC
1	ANKS1B	Downregulated	Upregulated
2	FAM177B	Downregulated	Upregulated
3	HLA-F	Downregulated	Upregulated
4	C5orf15	Downregulated	Upregulated
5	KDELC2	Downregulated	Upregulated
6	CHMP5	Downregulated	Upregulated
7	BET1	Downregulated	Upregulated
8	BISPR	Downregulated	Upregulated
9	COL20A1	Downregulated	Upregulated
10	MTMR7	Downregulated	Upregulated

Showing 1 to 10 of 301 entries

Previous1 2 3 4 5…31Next

#negative
S3.Negative.cor<-(overlap %>% filter(grupSH == 'Upregulated' & grupREC == 'Downregulated'))
create_dt(S3.Negative.cor)

Show entries

Search:

	Gene	grupSH	grupREC
1	FN1	Upregulated	Downregulated
2	CD70	Upregulated	Downregulated
3	SLC16A3	Upregulated	Downregulated
4	GP2	Upregulated	Downregulated
5	INPP5D	Upregulated	Downregulated
6	NME9	Upregulated	Downregulated
7	CXCR4	Upregulated	Downregulated
8	SNORA23	Upregulated	Downregulated
9	CEACAM3	Upregulated	Downregulated
10	IL18R1	Upregulated	Downregulated

Showing 1 to 10 of 62 entries

Previous1 2 3 4 5 6 7Next

8.1.2 Enrichment (Positive)

library(enrichR)
setEnrichrSite("Enrichr") # Human genes
websiteLive <- TRUE


dbs <- c("KEGG_2021_Human","MSigDB_Hallmark_2020")
if (is.null(dbs)) websiteLive <- FALSE
if (websiteLive) {
    enriched <- enrichr(c(S3.Positive.cor$Gene), dbs)
}

## Uploading data to Enrichr... Done.
##   Querying KEGG_2021_Human... Done.
##   Querying MSigDB_Hallmark_2020... Done.
## Parsing results... Done.

s3.kegg.pos<-as.data.frame(if (websiteLive) enriched[["KEGG_2021_Human"]])
create_dt(s1.kegg.pos)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Proteoglycans in cancer	3/205	0.00287802847588397	0.0921199654936703	11.7445544554455	68.7132748967338	PLAU;MYC;AKT3
2	Endometrial cancer	2/58	0.0029764701916058	0.0921199654936703	27.3571428571429	159.136969995712	MYC;AKT3
3	Acute myeloid leukemia	2/67	0.00395042124240719	0.0921199654936703	23.5585798816568	130.371604103407	MYC;AKT3
4	Central carbon metabolism in cancer	2/70	0.00430375556415394	0.0921199654936703	22.5158371040724	122.672297910598	MYC;AKT3
5	Salmonella infection	3/249	0.00496294101252886	0.0921199654936703	9.62243902439024	51.0543209773059	MYC;AKT3;IL18
6	Chronic myeloid leukemia	2/76	0.00505274789467576	0.0921199654936703	20.6839916839917	109.373287912458	MYC;AKT3
7	ErbB signaling pathway	2/85	0.00628031246106122	0.0921199654936703	18.4328081556997	93.4605223822077	MYC;AKT3
8	Colorectal cancer	2/86	0.00642430478069536	0.0921199654936703	18.2124542124542	91.9304015564488	MYC;AKT3
9	Small cell lung cancer	2/92	0.00731969302231779	0.0921199654936703	16.9931623931624	83.5585553177199	MYC;AKT3
10	MAPK signaling pathway	3/294	0.0078484280155866	0.0921199654936703	8.11587628865979	39.3412397510357	MYC;AKT3;EPHA2

Showing 1 to 10 of 125 entries

Previous1 2 3 4 5…13Next

colnames(s3.kegg.pos)

## [1] "Term"                 "Overlap"              "P.value"             
## [4] "Adjusted.P.value"     "Old.P.value"          "Old.Adjusted.P.value"
## [7] "Odds.Ratio"           "Combined.Score"       "Genes"

en.kegg.pos<-s3.kegg.pos %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1.8,
        legend.key.size= unit(.5, "cm"),
        axis.text.y = element_text(size=9))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("Top 20 KEGG_2021_Human",subtitle = 'Positively regulated by PRMT1')
en.kegg.pos

Msig.pos<-as.data.frame(if (websiteLive) enriched[["MSigDB_Hallmark_2020"]])
create_dt(Msig.pos)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	TNF-alpha Signaling via NF-kB	13/200	0.0000112416304417124	0.000505873369877056	4.70989304812834	53.6734073898163	KLF10;IL15RA;EGR1;CEBPB;DUSP1;LIF;IL18;FOS;F3;ZFP36;PLAU;MYC;SIK1
2	Complement	9/200	0.00339027065168711	0.0508540597753067	3.14803127017141	17.9023675335301	CASP9;CEBPB;PPP4C;CTSL;GNB2;PIM1;CTSV;RAF1;F3
3	Inflammatory Response	9/200	0.00339027065168711	0.0508540597753067	3.14803127017141	17.9023675335301	IL15RA;MYC;LAMP3;TPBG;C5AR1;LIF;IL18;RAF1;F3
4	Hypoxia	8/200	0.011050126032932	0.10033018203946	2.77403299203641	12.4978881369721	SULT2B1;ZFP36;DUSP1;TPBG;PIM1;BCL2;FOS;F3
5	Apoptosis	7/161	0.0111477980043844	0.10033018203946	3.02179962894249	13.5875621881609	CASP9;CASP8;IFNGR1;CTH;IL18;SC5D;BCL2L2
6	Coagulation	6/138	0.0182193349572579	0.136645012179434	3.01494607087827	12.07567874308	CASP9;PLAU;GNB2;CD9;CTSV;F3
7	Wnt-beta Catenin Signaling	3/42	0.0251529306346493	0.146677047171428	5.07485802787816	18.6895900274936	NCSTN;MYC;GNAI1
8	Estrogen Response Early	7/200	0.0321169094866193	0.146677047171428	2.40636565507032	8.2739817634756	SULT2B1;KLF10;MYC;TPBG;BCL2;FOS;AQP3
9	Interferon Gamma Response	7/200	0.0321169094866193	0.146677047171428	2.40636565507032	8.2739817634756	IL15RA;CASP8;PIM1;LYSMD2;ST3GAL5;IRF8;TDRD7
10	UV Response Up	6/158	0.0325948993714284	0.146677047171428	2.61556645851918	8.95465192505005	CEBPG;CTSV;FOS;HLA-F;AQP3;CLCN2

Showing 1 to 10 of 45 entries

Previous1 2 3 4 5Next

s3.en.Msig.pos<-Msig.pos %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("MSigDB_Hallmark_2020",subtitle = 'Positively regulated by PRMT1')
s3.en.Msig.pos

8.1.3 Enrichment (Negative)

library(enrichR)
setEnrichrSite("Enrichr") # Human genes
websiteLive <- TRUE


dbs <- c("KEGG_2021_Human","MSigDB_Hallmark_2020")
if (is.null(dbs)) websiteLive <- FALSE
if (websiteLive) {
    enriched <- enrichr(c(S3.Negative.cor$Gene), dbs)
}

## Uploading data to Enrichr... Done.
##   Querying KEGG_2021_Human... Done.
##   Querying MSigDB_Hallmark_2020... Done.
## Parsing results... Done.

kegg.neg<-as.data.frame(if (websiteLive) enriched[["KEGG_2021_Human"]])
create_dt(kegg.neg)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Sulfur metabolism	1/10	0.0305777019615052	0.514122376294957	36.3005464480874	126.597583267881	PAPSS2
2	Staphylococcus aureus infection	2/95	0.0351110097630564	0.514122376294957	7.11290322580645	23.8228237643677	KRT17;CFI
3	AGE-RAGE signaling pathway in diabetic complications	2/100	0.0385451967593686	0.514122376294957	6.74829931972789	21.9719482594704	FN1;CYBB
4	Viral protein interaction with cytokine and cytokine receptor	2/100	0.0385451967593686	0.514122376294957	6.74829931972789	21.9719482594704	CXCR4;IL18R1
5	Leukocyte transendothelial migration	2/114	0.0488006483752516	0.514122376294957	5.90059523809524	17.8198665370157	CYBB;CXCR4
6	Selenocompound metabolism	1/17	0.0514329074630838	0.514122376294957	20.4118852459016	60.5718017974293	PAPSS2
7	Cytokine-cytokine receptor interaction	3/295	0.0636232709451799	0.514122376294957	3.42105874158347	9.42425044815021	CD70;CXCR4;IL18R1
8	Mannose type O-glycan biosynthesis	1/23	0.0689569990042959	0.514122376294957	14.8405365126677	39.6876338058496	B4GAT1
9	Hippo signaling pathway	2/163	0.0909554982962847	0.514122376294957	4.09461697722567	9.8163730017081	ID2;TEAD2
10	Axon guidance	2/182	0.109392402129295	0.514122376294957	3.65888888888889	8.09643997886151	CXCR4;PLXNA3

Showing 1 to 10 of 73 entries

Previous1 2 3 4 5…8Next

en.kegg.neg<-kegg.neg %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1.5,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("KEGG_2021_Human",subtitle = 'Negatively regulated by PRMT1')
en.kegg.neg

Msig.neg<-as.data.frame(if (websiteLive) enriched[["MSigDB_Hallmark_2020"]])
create_dt(Msig.neg)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Xenobiotic Metabolism	3/200	0.0242012368323432	0.266213605155775	5.09532822851243	18.961507541578	CDA;ID2;PAPSS2
2	Inflammatory Response	3/200	0.0242012368323432	0.266213605155775	5.09532822851243	18.961507541578	CD70;CYBB;IL18R1
3	Coagulation	2/138	0.0683510344923525	0.28090462110834	4.85343137254902	13.0222348272391	CFI;FN1
4	Glycolysis	2/200	0.127683918685609	0.28090462110834	3.32323232323232	6.83986830769646	CXCR4;SLC16A3
5	p53 Pathway	2/200	0.127683918685609	0.28090462110834	3.32323232323232	6.83986830769646	KRT17;ZMAT3
6	Estrogen Response Early	2/200	0.127683918685609	0.28090462110834	3.32323232323232	6.83986830769646	CBFA2T3;PAPSS2
7	Estrogen Response Late	2/200	0.127683918685609	0.28090462110834	3.32323232323232	6.83986830769646	ID2;PAPSS2
8	KRAS Signaling Up	2/200	0.127683918685609	0.28090462110834	3.32323232323232	6.83986830769646	ID2;CXCR4
9	Complement	2/200	0.127683918685609	0.28090462110834	3.32323232323232	6.83986830769646	CDA;FN1
10	Epithelial Mesenchymal Transition	2/200	0.127683918685609	0.28090462110834	3.32323232323232	6.83986830769646	ID2;FN1

Showing 1 to 10 of 22 entries

Previous1 2 3Next

en.Msig.neg<-Msig.neg %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = .25,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("MSigDB_Hallmark_2020",subtitle = 'Negatively regulated by PRMT1')
en.Msig.neg

9 Conclusion

From the results above, it seems that although overlapping genes in 3 conditions (Scenario 1) identified less in venn diagram compared to Scenario 2, the enrichment analysis showed better results (reference to other enrichment analysis from other PRMT1 RNAseq published paper)
We can now collect and tweak the figuring for publication
For example for enrichment, we chose only KEGG and selected certain terms

9.1 KEGG term selected

create_dt(s1.kegg.pos)

Show entries

Search:

	Term	Overlap	P.value	Adjusted.P.value	Odds.Ratio	Combined.Score	Genes
1	Proteoglycans in cancer	3/205	0.00287802847588397	0.0921199654936703	11.7445544554455	68.7132748967338	PLAU;MYC;AKT3
2	Endometrial cancer	2/58	0.0029764701916058	0.0921199654936703	27.3571428571429	159.136969995712	MYC;AKT3
3	Acute myeloid leukemia	2/67	0.00395042124240719	0.0921199654936703	23.5585798816568	130.371604103407	MYC;AKT3
4	Central carbon metabolism in cancer	2/70	0.00430375556415394	0.0921199654936703	22.5158371040724	122.672297910598	MYC;AKT3
5	Salmonella infection	3/249	0.00496294101252886	0.0921199654936703	9.62243902439024	51.0543209773059	MYC;AKT3;IL18
6	Chronic myeloid leukemia	2/76	0.00505274789467576	0.0921199654936703	20.6839916839917	109.373287912458	MYC;AKT3
7	ErbB signaling pathway	2/85	0.00628031246106122	0.0921199654936703	18.4328081556997	93.4605223822077	MYC;AKT3
8	Colorectal cancer	2/86	0.00642430478069536	0.0921199654936703	18.2124542124542	91.9304015564488	MYC;AKT3
9	Small cell lung cancer	2/92	0.00731969302231779	0.0921199654936703	16.9931623931624	83.5585553177199	MYC;AKT3
10	MAPK signaling pathway	3/294	0.0078484280155866	0.0921199654936703	8.11587628865979	39.3412397510357	MYC;AKT3;EPHA2

Showing 1 to 10 of 125 entries

Previous1 2 3 4 5…13Next

en.kegg.pos<-s1.kegg.pos %>% 
  filter(P.value < 0.05) %>% 
  mutate(minlog=-(log10(P.value))) %>% 
  arrange(desc(minlog)) %>% 
  slice(1:20) %>% 
  filter(Term == "Proteoglycans in cancer" |
           Term == "Salmonella infection"|
           Term == "MAPK signaling pathway"|
           Term == "Signaling pathways regulating pluripotency of stem cells"|
           Term == "Breast cancer"|
           Term == "Gastric cancer") %>% 
  mutate(name=fct_reorder(Term,minlog)) %>% 
  ggplot(aes(x=minlog,y=name,fill=minlog))+
  geom_bar(stat="identity")+
  theme_Publication()+
  scale_x_continuous(expand=expand_scale(mult = c(0,0.2)))+
  theme(axis.title.y = element_blank(),
        legend.position = 'right',
        legend.direction = 'vertical',
        panel.grid.major.x = element_blank(),
        aspect.ratio = 1.5,
        legend.key.size= unit(.5, "cm"))+
  scale_fill_viridis_c()+
  xlab(expression(- log[10]*"(P-value)"))+
  labs(fill=expression(- log[10]*"(P-value)"))+
  ggtitle("KEGG_2021_Human",subtitle = 'Positively regulated by PRMT1')

en.kegg.pos

9.2 Connecting with clinical specimen

Remember, KEGG above is only enrichment from 28 genes as show in venn and datatable below. In total 28+14= 42 genes are regulated by PRMT1, now how about the expression of these genes in gastric cancer tissues?

grid.arrange(v1pos,v1neg,ncol=2)

# Positive
create_dt(S1.Positive.cor)

Show entries

Search:

	Gene	grupSH	grupSI	grupREC
1	PPP1R14C	Downregulated	Downregulated	Upregulated
2	MTHFSD	Downregulated	Downregulated	Upregulated
3	PTS	Downregulated	Downregulated	Upregulated
4	LOC730183	Downregulated	Downregulated	Upregulated
5	TFB2M	Downregulated	Downregulated	Upregulated
6	MYC	Downregulated	Downregulated	Upregulated
7	LOC654342	Downregulated	Downregulated	Upregulated
8	AMIGO3	Downregulated	Downregulated	Upregulated
9	TTC5	Downregulated	Downregulated	Upregulated
10	PCOLCE2	Downregulated	Downregulated	Upregulated

Showing 1 to 10 of 28 entries

Previous1 2 3Next

# Negative
create_dt(S1.Negative.cor)

Show entries

Search:

	Gene	grupSH	grupSI	grupREC
1	FN1	Upregulated	Upregulated	Downregulated
2	SLC16A3	Upregulated	Upregulated	Downregulated
3	NME9	Upregulated	Upregulated	Downregulated
4	CXCR4	Upregulated	Upregulated	Downregulated
5	IL18R1	Upregulated	Upregulated	Downregulated
6	EVI5L	Upregulated	Upregulated	Downregulated
7	CDC14A	Upregulated	Upregulated	Downregulated
8	GCNT7	Upregulated	Upregulated	Downregulated
9	KLB	Upregulated	Upregulated	Downregulated
10	FALEC	Upregulated	Upregulated	Downregulated

Showing 1 to 10 of 14 entries

Previous1 2Next

# In Gene Expression Note 2 we have downloaded rse of STAD TCGA using TCGAbiolinks
## Just need data preparation, normalization, filtering, and retrieve 42 genes from this dataset
library(TCGAbiolinks)

rse <- get(load("STADIllumina_HiSeq.rda"))

dataPrep_STAD<-TCGAanalyze_Preprocessing(rse,
                                         cor.cut = .5,
                                         datatype = "raw_count",
                                         filename = "STAD_IlluminaHiSeq_RNASeqV2.png")

# Normalization and filtering
dataNorm<-TCGAanalyze_Normalization(tabDF = dataPrep_STAD,geneInfo = geneInfo,method = "gcContent")

dim(dataNorm)

## [1] 19866   415

# quantile filter of genes
dataFilt <- TCGAanalyze_Filtering(tabDF = dataNorm,
                                  method = "quantile",
                                  qnt.cut =  0.25)
dim(dataFilt)

## [1] 14899   415

9.2.1 Gene filtering

f.dataFilt<-dataFilt
dim(f.dataFilt)

## [1] 14899   415

f.dataFilt<-as.data.frame(f.dataFilt) %>% 
  mutate(Gene=row.names(f.dataFilt)) %>% 
  select(416,1:415)
rownames(f.dataFilt)<-NULL

# get both pos and neg genes
genelist<-rbind(S1.Positive.cor,S1.Negative.cor) %>% 
  select(Gene)

# vlookup leftjoin to other parameter
genelist<-genelist %>% 
  left_join(f.dataFilt)

# check how many genes does not have expression
# probably different gene names/id
# or excluded before because of filtering threshold
sum(is.na(genelist$`TCGA-3M-AB46-01A-11R-A414-31`)) #total 9 genes were not identified, let's ignore this for now

## [1] 9

# exclude those gene
genelist<-genelist %>% 
      drop_na()

create_dt(genelist)

Show entries

Search:

	Gene	TCGA-3M-AB46-01A-11R-A414-31	TCGA-3M-AB47-01A-22R-A414-31	TCGA-B7-5816-01A-21R-1602-13	TCGA-B7-5818-01A-11R-1602-13	TCGA-B7-A5TI-01A-11R-A31P-31	TCGA-B7-A5TJ-01A-11R-A31P-31	TCGA-B7-A5TK-01A-12R-A36D-31	TCGA-B7-A5TN-01A-21R-A31P-31	TCGA-BR-4187-01A-01R-1131-13	TCGA-BR-4191-01A-02R-1131-13	TCGA-BR-4201-01A-01R-1131-13	TCGA-BR-4253-01A-01R-1131-13	TCGA-BR-4255-01A-01R-1131-13	TCGA-BR-4256-01A-01R-1131-13	TCGA-BR-4257-01A-01R-1131-13	TCGA-BR-4267-01A-01R-1131-13	TCGA-BR-4279-01A-01R-1131-13	TCGA-BR-4280-01A-01R-1131-13	TCGA-BR-4292-01A-01R-1131-13	TCGA-BR-4294-01A-01R-1131-13	TCGA-BR-4357-01A-01R-1157-13	TCGA-BR-4361-01A-01R-1157-13	TCGA-BR-4362-01A-01R-1157-13	TCGA-BR-4363-01A-01R-1157-13	TCGA-BR-4366-01A-01R-1157-13	TCGA-BR-4367-01A-01R-1157-13	TCGA-BR-4368-01A-01R-1157-13	TCGA-BR-4369-01A-01R-1157-13	TCGA-BR-4370-01A-01R-1157-13	TCGA-BR-4371-01A-01R-1157-13	TCGA-BR-6452-01A-12R-1802-13	TCGA-BR-6453-01A-11R-1802-13	TCGA-BR-6454-01A-11R-1802-13	TCGA-BR-6455-01A-11R-1802-13	TCGA-BR-6456-01A-11R-1802-13	TCGA-BR-6457-01A-21R-1802-13	TCGA-BR-6458-01A-11R-1802-13	TCGA-BR-6563-01A-13R-2055-13	TCGA-BR-6564-01A-12R-1884-13	TCGA-BR-6565-01A-11R-1802-13	TCGA-BR-6566-01A-11R-1802-13	TCGA-BR-6705-01A-12R-1884-13	TCGA-BR-6706-01A-11R-1884-13	TCGA-BR-6707-01A-11R-1884-13	TCGA-BR-6709-01A-11R-1884-13	TCGA-BR-6801-01A-11R-1884-13	TCGA-BR-6802-01A-11R-1884-13	TCGA-BR-6803-01A-11R-1884-13	TCGA-BR-6852-01A-11R-1884-13	TCGA-BR-7196-01A-11R-2055-13	TCGA-BR-7197-01A-11R-2203-13	TCGA-BR-7703-01A-11R-2055-13	TCGA-BR-7704-01A-11R-2055-13	TCGA-BR-7707-01A-11R-2055-13	TCGA-BR-7715-01A-11R-2055-13	TCGA-BR-7716-01A-21R-2055-13	TCGA-BR-7717-01A-11R-2055-13	TCGA-BR-7722-01A-31R-2203-13	TCGA-BR-7723-01A-11R-2055-13	TCGA-BR-7851-01A-11R-2203-13	TCGA-BR-7901-01A-11R-2203-13	TCGA-BR-7957-01A-11R-2203-13	TCGA-BR-7958-01A-21R-2343-13	TCGA-BR-7959-01A-11R-2343-13	TCGA-BR-8058-01A-31R-2343-13	TCGA-BR-8059-01A-11R-2343-13	TCGA-BR-8060-01A-11R-2343-13	TCGA-BR-8077-01A-11R-2343-13	TCGA-BR-8078-01A-11R-2343-13	TCGA-BR-8080-01A-11R-2343-13	TCGA-BR-8081-01A-11R-2343-13	TCGA-BR-8284-01A-11R-2343-13	TCGA-BR-8286-01A-12R-2343-13	TCGA-BR-8289-01A-11R-2343-13	TCGA-BR-8291-01A-11R-2343-13	TCGA-BR-8295-01A-11R-2343-13	TCGA-BR-8296-01A-11R-2343-13	TCGA-BR-8297-01A-12R-2343-13	TCGA-BR-8361-01A-11R-2343-13	TCGA-BR-8362-01A-11R-2343-13	TCGA-BR-8363-01A-11R-2343-13	TCGA-BR-8364-01A-11R-2343-13	TCGA-BR-8365-01A-21R-2343-13	TCGA-BR-8366-01A-11R-2343-13	TCGA-BR-8367-01A-11R-2343-13	TCGA-BR-8368-01A-11R-2343-13	TCGA-BR-8369-01A-11R-2343-13	TCGA-BR-8371-01A-11R-2343-13	TCGA-BR-8372-01A-11R-2343-13	TCGA-BR-8373-01A-11R-2343-13	TCGA-BR-8380-01A-11R-2343-13	TCGA-BR-8381-01A-11R-2402-13	TCGA-BR-8382-01A-11R-2402-13	TCGA-BR-8384-01A-21R-2402-13	TCGA-BR-8483-01A-31R-2402-13	TCGA-BR-8484-01A-11R-2402-13	TCGA-BR-8485-01A-11R-2402-13	TCGA-BR-8486-01A-31R-2402-13	TCGA-BR-8487-01A-11R-2402-13	TCGA-BR-8588-01A-11R-2402-13	TCGA-BR-8589-01A-11R-2402-13	TCGA-BR-8590-01A-11R-2402-13	TCGA-BR-8591-01A-11R-2402-13	TCGA-BR-8592-01A-11R-2402-13	TCGA-BR-8676-01A-11R-2402-13	TCGA-BR-8677-01A-11R-2402-13	TCGA-BR-8678-01A-11R-2402-13	TCGA-BR-8679-01A-11R-2402-13	TCGA-BR-8680-01A-11R-2402-13	TCGA-BR-8682-01A-11R-2402-13	TCGA-BR-8683-01A-11R-2402-13	TCGA-BR-8686-01A-11R-2402-13	TCGA-BR-8687-01A-11R-2402-13	TCGA-BR-8690-01A-11R-2402-13	TCGA-BR-A44T-01A-32R-A24K-31	TCGA-BR-A44U-01A-11R-A36D-31	TCGA-BR-A452-01A-91R-A251-31	TCGA-BR-A453-01A-11R-A24K-31	TCGA-BR-A4CR-01A-11R-A24K-31	TCGA-BR-A4CS-01A-11R-A24K-31	TCGA-BR-A4IU-01A-22R-A251-31	TCGA-BR-A4IV-01A-31R-A251-31	TCGA-BR-A4IY-01A-11R-A251-31	TCGA-BR-A4IZ-01A-32R-A251-31	TCGA-BR-A4J1-01A-11R-A251-31	TCGA-BR-A4J2-01A-21R-A251-31	TCGA-BR-A4J4-01A-12R-A251-31	TCGA-BR-A4J5-01A-21R-A251-31	TCGA-BR-A4J6-01A-11R-A251-31	TCGA-BR-A4J7-01A-31R-A251-31	TCGA-BR-A4J8-01A-11R-A251-31	TCGA-BR-A4J9-01A-12R-A251-31	TCGA-BR-A4PD-01A-11R-A251-31	TCGA-BR-A4PE-01A-31R-A251-31	TCGA-BR-A4PF-01A-11R-A251-31	TCGA-BR-A4QI-01A-12R-A251-31	TCGA-BR-A4QL-01A-31R-A251-31	TCGA-BR-A4QM-01A-12R-A251-31	TCGA-CD-5798-01A-11R-1602-13	TCGA-CD-5799-01A-11R-1602-13	TCGA-CD-5800-01A-11R-1602-13	TCGA-CD-5801-01A-11R-1602-13	TCGA-CD-5803-01A-11R-1602-13	TCGA-CD-5804-01A-12R-2055-13	TCGA-CD-5813-01A-11R-1602-13	TCGA-CD-8524-01A-11R-2343-13	TCGA-CD-8525-01A-11R-2343-13	TCGA-CD-8526-01A-11R-2343-13	TCGA-CD-8527-01A-11R-2343-13	TCGA-CD-8528-01A-11R-2343-13	TCGA-CD-8529-01A-11R-2343-13	TCGA-CD-8530-01A-11R-2343-13	TCGA-CD-8531-01A-11R-2343-13	TCGA-CD-8532-01A-11R-2343-13	TCGA-CD-8533-01A-11R-2343-13	TCGA-CD-8534-01A-11R-2343-13	TCGA-CD-8535-01A-11R-2343-13	TCGA-CD-8536-01A-11R-2343-13	TCGA-CD-A486-01A-11R-A24K-31	TCGA-CD-A487-01A-21R-A24K-31	TCGA-CD-A489-01A-11R-A24K-31	TCGA-CD-A48A-01A-12R-A36D-31	TCGA-CD-A48C-01A-11R-A24K-31	TCGA-CD-A4MG-01A-11R-A251-31	TCGA-CD-A4MH-01A-11R-A251-31	TCGA-CD-A4MI-01A-21R-A251-31	TCGA-CD-A4MJ-01A-11R-A251-31	TCGA-CG-4301-01A-01R-1157-13	TCGA-CG-4304-01A-01R-1157-13	TCGA-CG-4305-01A-01R-1157-13	TCGA-CG-4306-01A-01R-1157-13	TCGA-CG-4436-01A-01R-1157-13	TCGA-CG-4437-01A-01R-1802-13	TCGA-CG-4438-01A-01R-1157-13	TCGA-CG-4440-01A-01R-1157-13	TCGA-CG-4441-01A-01R-1802-13	TCGA-CG-4442-01A-01R-1157-13	TCGA-CG-4443-01A-01R-1157-13	TCGA-CG-4444-01A-01R-1157-13	TCGA-CG-4449-01A-01R-1157-13	TCGA-CG-4460-01A-01R-1157-13	TCGA-CG-4462-01A-01R-1157-13	TCGA-CG-4465-01A-01R-1157-13	TCGA-CG-4466-01A-01R-1157-13	TCGA-CG-4469-01A-01R-1157-13	TCGA-CG-4472-01A-01R-1157-13	TCGA-CG-4474-01A-02R-1157-13	TCGA-CG-4475-01A-01R-1157-13	TCGA-CG-4476-01A-01R-1157-13	TCGA-CG-4477-01A-01R-1157-13	TCGA-CG-5716-01A-21R-1802-13	TCGA-CG-5717-01A-11R-1602-13	TCGA-CG-5718-01A-11R-1602-13	TCGA-CG-5719-01A-11R-1602-13	TCGA-CG-5720-01A-11R-1602-13	TCGA-CG-5721-01A-11R-1602-13	TCGA-CG-5722-01A-21R-1602-13	TCGA-CG-5723-01A-11R-1602-13	TCGA-CG-5724-01A-11R-1602-13	TCGA-CG-5725-01A-11R-1602-13	TCGA-CG-5726-01A-11R-1602-13	TCGA-CG-5732-01A-11R-1602-13	TCGA-CG-5734-01A-11R-1602-13	TCGA-D7-5577-01A-01R-1602-13	TCGA-D7-5578-01A-01R-1602-13	TCGA-D7-6518-01A-11R-1802-13	TCGA-D7-6519-01A-11R-1802-13	TCGA-D7-6520-01A-11R-1802-13	TCGA-D7-6521-01A-11R-1802-13	TCGA-D7-6522-01A-11R-1802-13	TCGA-D7-6524-01A-11R-1802-13	TCGA-D7-6525-01A-11R-1802-13	TCGA-D7-6526-01A-11R-1802-13	TCGA-D7-6527-01A-11R-1802-13	TCGA-D7-6528-01A-11R-1802-13	TCGA-D7-6815-01A-11R-1884-13	TCGA-D7-6817-01A-11R-1884-13	TCGA-D7-6818-01A-11R-1884-13	TCGA-D7-6820-01A-11R-1884-13	TCGA-D7-6822-01A-11R-1884-13	TCGA-D7-8570-01A-11R-2343-13	TCGA-D7-8572-01A-11R-2343-13	TCGA-D7-8573-01A-11R-2343-13	TCGA-D7-8574-01A-13R-2343-13	TCGA-D7-8575-01A-11R-2343-13	TCGA-D7-8576-01A-11R-2343-13	TCGA-D7-8578-01A-21R-2343-13	TCGA-D7-8579-01A-11R-2343-13	TCGA-D7-A4YT-01A-11R-A251-31	TCGA-D7-A4YU-01A-21R-A251-31	TCGA-D7-A4YV-01A-11R-A251-31	TCGA-D7-A4YX-01A-11R-A251-31	TCGA-D7-A4YY-01A-11R-A251-31	TCGA-D7-A4Z0-01A-22R-A251-31	TCGA-D7-A6EV-01A-11R-A31P-31	TCGA-D7-A6EX-01A-11R-A31P-31	TCGA-D7-A6EY-01A-21R-A31P-31	TCGA-D7-A6EZ-01A-11R-A31P-31	TCGA-D7-A6F0-01A-11R-A31P-31	TCGA-D7-A6F2-01A-12R-A31P-31	TCGA-D7-A747-01A-22R-A33Y-31	TCGA-D7-A748-01A-12R-A32D-31	TCGA-D7-A74A-01A-11R-A32D-31	TCGA-EQ-8122-01A-11R-2343-13	TCGA-EQ-A4SO-01A-11R-A251-31	TCGA-F1-6177-01A-11R-1802-13	TCGA-F1-6874-01A-11R-1884-13	TCGA-F1-6875-01A-11R-2055-13	TCGA-F1-A448-01A-11R-A24K-31	TCGA-F1-A72C-01A-21R-A33Y-31	TCGA-FP-7735-01A-11R-2055-13	TCGA-FP-7829-01A-11R-2055-13	TCGA-FP-7916-01A-11R-2203-13	TCGA-FP-7998-01A-11R-2203-13	TCGA-FP-8099-01A-11R-2343-13	TCGA-FP-8209-01A-11R-2343-13	TCGA-FP-8210-01A-11R-2343-13	TCGA-FP-8211-01A-11R-2343-13	TCGA-FP-8631-01A-11R-2402-13	TCGA-FP-A4BE-01A-12R-A24K-31	TCGA-FP-A4BF-01A-12R-A36D-31	TCGA-FP-A8CX-01A-11R-A36D-31	TCGA-FP-A9TM-01A-11R-A39E-31	TCGA-HF-7131-01A-11R-2055-13	TCGA-HF-7132-01A-11R-2055-13	TCGA-HF-7133-01A-11R-2055-13	TCGA-HF-7134-01A-11R-2055-13	TCGA-HF-7136-01A-11R-2055-13	TCGA-HF-A5NB-01A-11R-A31P-31	TCGA-HJ-7597-01A-21R-2203-13	TCGA-HU-8238-01A-11R-2343-13	TCGA-HU-8243-01A-11R-2343-13	TCGA-HU-8244-01A-11R-2343-13	TCGA-HU-8249-01A-11R-A36D-31	TCGA-HU-8602-01A-11R-2402-13	TCGA-HU-8604-01A-11R-2402-13	TCGA-HU-8608-01A-11R-2402-13	TCGA-HU-8610-01A-22R-2402-13	TCGA-HU-A4G2-01A-11R-A251-31	TCGA-HU-A4G3-01A-11R-A24K-31	TCGA-HU-A4G6-01A-11R-A24K-31	TCGA-HU-A4G8-01A-11R-A251-31	TCGA-HU-A4G9-01A-11R-A24K-31	TCGA-HU-A4GC-01A-12R-A251-31	TCGA-HU-A4GD-01A-11R-A36D-31	TCGA-HU-A4GF-01A-11R-A24K-31	TCGA-HU-A4GH-01A-11R-A24K-31	TCGA-HU-A4GJ-01A-11R-A251-31	TCGA-HU-A4GN-01A-11R-A251-31	TCGA-HU-A4GP-01A-11R-A251-31	TCGA-HU-A4GQ-01A-11R-A36D-31	TCGA-HU-A4GT-01A-21R-A251-31	TCGA-HU-A4GU-01A-11R-A251-31	TCGA-HU-A4GX-01A-12R-A251-31	TCGA-HU-A4GY-01A-21R-A24K-31	TCGA-HU-A4H0-01A-11R-A251-31	TCGA-HU-A4H2-01A-11R-A251-31	TCGA-HU-A4H3-01A-21R-A251-31	TCGA-HU-A4H4-01A-21R-A251-31	TCGA-HU-A4H5-01A-21R-A251-31	TCGA-HU-A4H6-01A-11R-A251-31	TCGA-HU-A4H8-01A-11R-A251-31	TCGA-HU-A4HB-01A-12R-A251-31	TCGA-HU-A4HD-01A-11R-A251-31	TCGA-IN-7806-01A-11R-2055-13	TCGA-IN-7808-01A-11R-2203-13	TCGA-IN-8462-01A-11R-2343-13	TCGA-IN-8663-01A-11R-2402-13	TCGA-IN-A6RI-01A-11R-A32D-31	TCGA-IN-A6RJ-01A-21R-A33Y-31	TCGA-IN-A6RL-01A-11R-A32D-31	TCGA-IN-A6RN-01A-12R-A33Y-31	TCGA-IN-A6RO-01A-12R-A33Y-31	TCGA-IN-A6RR-01A-12R-A32D-31	TCGA-IN-A6RS-01A-12R-A354-31	TCGA-IN-A7NR-01A-11R-A354-31	TCGA-IN-A7NT-01A-21R-A354-31	TCGA-IN-A7NU-01A-22R-A354-31	TCGA-IN-AB1V-01A-21R-A414-31	TCGA-IN-AB1X-01A-11R-A39E-31	TCGA-IP-7968-01A-11R-2203-13	TCGA-KB-A6F7-01A-12R-A32D-31	TCGA-KB-A93G-01A-11R-A39E-31	TCGA-KB-A93H-01A-11R-A39E-31	TCGA-KB-A93J-01A-11R-A39E-31	TCGA-MX-A5UG-01A-21R-A31P-31	TCGA-MX-A5UJ-01A-11R-A31P-31	TCGA-MX-A663-01A-11R-A31P-31	TCGA-MX-A666-01A-11R-A31P-31	TCGA-R5-A7O7-01A-11R-A33Y-31	TCGA-R5-A7ZE-01B-11R-A354-31	TCGA-R5-A7ZF-01A-11R-A354-31	TCGA-R5-A7ZI-01A-11R-A354-31	TCGA-R5-A7ZR-01A-11R-A354-31	TCGA-R5-A805-01A-11R-A36D-31	TCGA-RD-A7BS-01A-11R-A32D-31	TCGA-RD-A7BT-01A-11R-A33Y-31	TCGA-RD-A7BW-01A-11R-A32D-31	TCGA-RD-A7C1-01A-11R-A32D-31	TCGA-RD-A8MV-01A-11R-A36D-31	TCGA-RD-A8MW-01A-11R-A36D-31	TCGA-RD-A8N0-01A-12R-A36D-31	TCGA-RD-A8N1-01A-12R-A36D-31	TCGA-RD-A8N2-01A-12R-A36D-31	TCGA-RD-A8N4-01A-21R-A36D-31	TCGA-RD-A8N5-01A-12R-A36D-31	TCGA-RD-A8N6-01A-11R-A36D-31	TCGA-RD-A8N9-01A-12R-A39E-31	TCGA-RD-A8NB-01A-12R-A39E-31	TCGA-SW-A7EA-01A-12R-A354-31	TCGA-SW-A7EB-01A-11R-A354-31	TCGA-VQ-A8DT-01A-11R-A36D-31	TCGA-VQ-A8DU-01A-11R-A36D-31	TCGA-VQ-A8DV-01A-12R-A36D-31	TCGA-VQ-A8DZ-01A-11R-A36D-31	TCGA-VQ-A8E0-01A-11R-A414-31	TCGA-VQ-A8E2-01A-11R-A36D-31	TCGA-VQ-A8E3-01A-11R-A39E-31	TCGA-VQ-A8E7-01B-11R-A414-31	TCGA-VQ-A8P2-01A-11R-A36D-31	TCGA-VQ-A8P3-01A-11R-A36D-31	TCGA-VQ-A8P5-01A-11R-A39E-31	TCGA-VQ-A8P8-01A-11R-A39E-31	TCGA-VQ-A8PB-01A-11R-A39E-31	TCGA-VQ-A8PC-01A-11R-A39E-31	TCGA-VQ-A8PD-01A-11R-A414-31	TCGA-VQ-A8PE-01A-11R-A414-31	TCGA-VQ-A8PF-01A-11R-A414-31	TCGA-VQ-A8PH-01A-12R-A414-31	TCGA-VQ-A8PJ-01A-11R-A414-31	TCGA-VQ-A8PK-01A-12R-A414-31	TCGA-VQ-A8PM-01A-21R-A414-31	TCGA-VQ-A8PO-01A-11R-A414-31	TCGA-VQ-A8PP-01A-21R-A414-31	TCGA-VQ-A8PQ-01A-11R-A414-31	TCGA-VQ-A8PU-01A-12R-A414-31	TCGA-VQ-A8PX-01A-12R-A414-31	TCGA-VQ-A91A-01A-11R-A414-31	TCGA-VQ-A91D-01A-11R-A414-31	TCGA-VQ-A91E-01A-31R-A414-31	TCGA-VQ-A91K-01A-11R-A414-31	TCGA-VQ-A91N-01A-11R-A414-31	TCGA-VQ-A91Q-01A-12R-A414-31	TCGA-VQ-A91S-01A-11R-A414-31	TCGA-VQ-A91U-01A-11R-A414-31	TCGA-VQ-A91V-01A-11R-A414-31	TCGA-VQ-A91W-01A-11R-A414-31	TCGA-VQ-A91X-01A-12R-A414-31	TCGA-VQ-A91Y-01A-11R-A414-31	TCGA-VQ-A91Z-01A-11R-A414-31	TCGA-VQ-A922-01A-11R-A414-31	TCGA-VQ-A923-01A-11R-A414-31	TCGA-VQ-A924-01A-11R-A414-31	TCGA-VQ-A925-01A-11R-A414-31	TCGA-VQ-A927-01A-12R-A414-31	TCGA-VQ-A928-01A-11R-A414-31	TCGA-VQ-A92D-01A-11R-A414-31	TCGA-VQ-A94O-01A-11R-A414-31	TCGA-VQ-A94P-01A-13R-A414-31	TCGA-VQ-A94R-01A-11R-A414-31	TCGA-VQ-A94T-01A-11R-A414-31	TCGA-VQ-A94U-01A-12R-A414-31	TCGA-VQ-AA64-01A-11R-A414-31	TCGA-VQ-AA68-01A-11R-A414-31	TCGA-VQ-AA69-01A-11R-A414-31	TCGA-VQ-AA6A-01A-11R-A414-31	TCGA-VQ-AA6B-01A-11R-A414-31	TCGA-VQ-AA6D-01A-11R-A414-31	TCGA-VQ-AA6F-01A-31R-A414-31	TCGA-VQ-AA6G-01A-11R-A414-31	TCGA-VQ-AA6I-01A-11R-A414-31	TCGA-VQ-AA6J-01A-11R-A414-31	TCGA-VQ-AA6K-01A-11R-A414-31	TCGA-ZA-A8F6-01A-23R-A36D-31	TCGA-ZQ-A9CR-01A-11R-A39E-31
1	PPP1R14C	865	1001	34	24	10	18	6	64	360	78	65	10	52	29	91	7	329	200	50	5	19	105	55	41	1371	0	47	320	92	29	34	395	88	0	3995	2	10	54	21	4	193	5	16	5	218	1390	5	4	2	6	390	632	4	184	156	49	9	1	5	1206	56	67	13	460	2	241	47	116	35	12	31	15	35	6	18	27	25	1	4	261	32	5	33	21	140	26	35	8	28	15	30	9	19	6	334	9	408	363	19	136	251	30	13	280	20	24	93	8	835	238	334	2	92	449	41	285	153	12	1702	23	4	7	12	14	124	19	418	3	10	9	6	18	61	234	21	31	35	13	81	44	432	0	1	20	24	41	255	20	224	585	20	18	73	1	804	300	16	16	104	851	2669	80	27	22	2163	15	17	105	148	17	15	944	9	556	23	426	179	21	45	67	43	66	553	63	42	62	266	172	8	201	23	676	1300	4	475	177	14	108	1702	2980	33	1566	57	30	17	115	2087	17	74	122	6	240	64	12	2665	1725	362	529	70	185	5	109	342	143	597	19	332	136	373	11	0	6	42	558	26	2506	137	10	15	196	102	594	82	112	53	120	8	64	163	24	34	483	26	0	62	6	8	54	149	32	240	19	23	47	229	479	193	251	104	47	29	62	1588	1764	9	83	0	20	12	141	20	150	6	4	1151	168	395	11	339	47	66	1135	1479	22	11	5	5	167	7	6	15	26	106	224	618	5	342	5711	217	1560	37	791	128	313	692	571	792	13	674	287	508	3	22	49	54	174	781	71	229	46	856	996	21	21	608	611	76	103	17	16	160	16	21	38	3	30	241	10	25	8	240	120	333	41	406	31	266	21	496	224	84	5	34	296	79	84	146	3	398	135	1623	24	10	197	4	527	571	10	33	22	297	600	43	0	0	80	50	366	158	268	1336	2	782	337	235	245	224	161	4	124	113	170	405	362	35	13	399	1131	177	88	4	15	34	386	30
2	MTHFSD	774	461	539	395	562	1139	581	435	437	608	531	722	498	615	503	748	274	805	487	213	529	459	231	551	366	831	719	1056	563	910	621	557	870	923	439	645	923	705	573	607	507	692	549	925	955	655	733	587	753	575	1858	823	771	779	1034	1189	680	734	433	652	510	766	961	444	718	755	426	582	692	403	437	539	640	1120	489	601	704	660	750	635	637	680	536	577	673	737	1101	794	876	490	581	732	407	587	1265	558	1184	910	712	538	793	751	630	776	1291	530	750	1035	838	642	859	857	476	1334	742	964	2016	737	773	2079	745	555	1338	649	815	594	1035	619	894	558	895	666	780	672	855	948	930	591	664	680	853	1069	499	1029	492	754	998	542	1034	1149	483	505	891	682	966	491	1288	495	736	893	841	632	828	574	754	622	674	855	552	383	557	722	496	1093	571	864	724	713	532	171	566	784	633	917	981	685	544	362	443	205	576	625	428	915	755	635	757	1087	619	764	913	729	544	561	1114	535	857	894	957	488	547	1068	1128	881	1080	969	632	342	847	1572	746	573	997	678	458	1102	664	586	464	874	759	617	966	623	689	841	712	641	858	1164	621	607	1073	493	457	931	564	922	431	591	1574	966	907	807	967	695	542	889	867	735	747	854	846	1303	647	579	949	560	766	658	947	493	973	887	877	461	753	394	831	750	967	800	842	1021	923	803	574	829	663	551	612	671	711	818	680	1122	952	663	543	615	695	867	451	533	846	419	921	1731	501	847	544	293	1353	900	488	787	853	892	1104	417	852	324	542	847	1118	623	740	774	695	571	761	796	894	513	255	338	1256	520	540	765	709	524	727	631	389	497	881	557	733	729	935	547	270	896	1091	940	1198	770	581	828	1009	799	473	479	340	661	689	776	1577	948	559	398	783	805	772	1060	577	605	597	768	586	529	1020	802	583	1205	1021	746	483	958	849	930	631	643	483	687	828	834	723	1613	1040	823	1103	843	967	798	1018	520	630	820	744	1017	1297	573	244
3	PTS	763	453	612	717	532	1181	881	808	448	461	737	570	550	448	741	535	706	570	635	343	447	705	843	464	515	869	621	377	413	545	409	428	409	520	620	494	484	495	556	524	971	415	467	790	543	960	819	517	637	413	595	1078	1285	1406	676	584	1074	469	399	504	835	361	500	519	302	845	292	865	459	326	713	842	933	493	365	632	921	403	971	428	487	288	379	649	363	678	510	390	857	242	263	453	558	237	749	657	420	512	1142	581	628	272	502	234	1719	578	1510	585	645	241	316	321	694	1109	500	944	1114	600	870	686	426	539	934	542	801	656	736	728	1380	436	758	578	1301	799	394	549	1284	1231	1280	946	627	907	453	940	385	1023	1452	562	1195	686	292	609	2039	245	301	282	1139	1040	1309	1114	813	1229	1935	1028	942	551	958	528	294	567	1002	1434	740	813	798	685	1025	339	594	817	637	405	841	942	584	300	404	1115	405	896	882	656	495	435	587	646	943	1615	790	751	810	874	1196	715	713	627	968	301	506	686	525	573	1255	553	1273	299	454	649	768	800	914	297	840	150	160	643	591	214	273	409	435	608	701	771	1844	813	442	518	560	507	299	1067	961	944	1543	623	436	1187	872	967	817	706	317	234	332	147	220	596	537	1122	1045	744	398	803	341	417	421	493	769	491	857	1118	740	530	549	734	349	238	1391	808	622	815	1012	959	802	512	902	489	1029	1138	859	1092	670	851	294	657	782	1007	890	1447	1049	578	430	764	520	349	873	817	1310	1191	962	1409	270	1764	720	498	438	1110	574	357	145	692	536	1744	640	262	772	297	255	957	785	1449	2147	778	572	1154	1413	493	1143	728	1637	591	363	327	411	725	310	490	329	1430	686	937	1109	862	1272	1032	447	445	639	977	1181	382	626	696	491	298	529	300	802	776	554	442	753	463	152	674	885	490	639	724	571	717	456	635	766	905	323	983	294	482	403	412	659	900	542	756	590	390	424	314	984	606	655	768	674	833	696	605	456	764	640	510	491	355	1658
4	TFB2M	1399	1029	541	815	1399	1480	491	563	697	1173	909	814	1475	830	1832	2003	944	1385	1523	1868	893	1004	913	894	1321	1153	1161	1128	477	1665	1098	871	1225	1301	453	877	1864	825	430	1282	1213	821	665	1349	901	1188	872	754	651	691	1017	1648	554	1235	1083	1636	1328	633	1749	941	1319	1031	659	539	949	1708	1017	1003	696	997	774	1139	1299	948	701	2471	785	796	1143	280	750	537	464	718	720	1440	906	346	1413	681	723	1780	761	512	1113	1624	954	1024	911	1160	1226	1208	985	527	968	406	853	2087	1269	620	663	574	1161	909	486	1197	2766	427	522	1022	533	531	644	769	2332	631	714	798	1599	808	931	536	1084	1300	1205	822	1663	672	688	1269	838	925	903	748	990	1125	865	1578	784	2833	1018	947	1006	794	868	758	719	1624	727	1259	519	512	1444	1571	796	478	1076	878	856	1085	1344	2035	1338	1086	1848	1016	1516	1462	925	1567	1752	658	1319	2132	1344	923	1025	1010	714	718	1034	635	1466	835	1575	781	1526	1546	1178	1209	1852	1457	1055	1625	1776	495	666	1491	1328	974	914	1167	1904	2092	1290	1332	1640	805	1601	1491	1340	1052	1613	346	463	1148	377	546	1096	867	547	1316	1055	727	1301	1460	733	761	1323	627	291	547	1368	1236	3038	1177	1096	899	1058	920	1776	1653	685	573	535	304	458	1323	1449	1967	897	1268	691	864	983	940	2012	935	1859	773	553	1685	2177	1740	716	678	1078	1189	1347	1262	1381	985	1338	1006	1307	1462	936	646	1202	751	1173	1721	949	1009	483	1059	1522	914	1638	957	1248	1067	593	1675	1193	1025	488	634	1437	580	1669	811	1345	1272	1048	696	1184	672	433	320	600	2120	540	939	629	440	679	689	1447	1089	1136	1810	1164	1824	554	564	1740	252	1697	818	955	563	1289	417	538	492	748	878	906	915	1063	1727	1439	2099	1160	1880	1038	959	513	1720	553	1153	797	735	599	569	773	869	913	2143	867	934	1207	814	287	1347	1661	972	773	869	985	618	657	1222	1228	1405	1017	1199	795	1610	1302	649	975	1166	687	901	1422	1637	537	1119	1400	1464	2806	914	832	1381	1182	799	859	783	984	634	1044	555	1113
5	MYC	1383	4929	5002	2623	3720	7121	11026	3147	7365	4062	9358	11006	5362	9446	8570	6389	4375	17819	13369	6036	3786	11213	12830	8497	4254	7040	26296	7463	3801	11829	5603	6709	1623	9241	15492	4161	4774	4897	4131	11385	6415	8881	3772	6786	4268	3435	5283	4378	5642	4529	3821	10036	2707	11758	10723	6192	7847	4442	3639	8402	2909	11576	6503	19508	4128	8823	8547	13110	23949	7394	18258	8497	4759	3671	7080	22043	4151	5660	23828	6900	7276	6994	4839	6398	9527	9527	8487	2706	24994	4369	11469	3652	11758	7451	6095	2949	5594	6715	2473	6969	7782	7303	5946	6812	4791	16011	4288	8995	14191	9854	8438	7422	3070	6719	4873	2417	10851	9056	28515	1310	5045	5609	6164	12217	18067	5721	3875	1728	901	4774	3007	3234	2202	7455	7499	6053	7463	4080	5007	3815	4859	2711	5427	1580	5837	4185	4117	2550	2740	52295	3751	4481	3335	5191	1782	3990	8038	7721	2319	12356	2690	3900	6815	7170	259	2841	11364	5797	5402	10768	8005	27049	8487	11203	12293	3485	20973	6000	17050	11184	2392	5028	10823	17788	11396	5575	4575	4735	3815	10139	2647	12844	5855	5335	6621	8178	12117	8066	11055	8293	13048	4148	4439	7350	11923	2836	5197	1110	2439	4110	3272	6228	15757	2906	7875	6650	2737	1340	3727	3664	3646	4847	17788	2521	3370	5979	1532	7373	6835	17164	7269	13110	8817	2824	11223	9044	10659	6098	1074	5379	4766	2286	9081	9433	11633	12425	6045	9105	5279	8675	4272	2811	3371	5349	6000	7110	6117	4858	3031	8298	8608	3153	8412	3923	6231	2819	3546	9056	4816	14959	7957	16308	14470	8731	29480	20218	7599	4112	6439	3152	20086	6002	14063	6818	14171	14319	1030	4606	14857	6647	14819	8782	8095	10171	3765	7474	4766	11805	7091	5201	5039	3753	2836	6776	8056	6008	9967	3488	2193	7114	5946	8459	6406	5269	20218	7373	13400	6291	4870	6839	8422	9338	5000	3209	1166	5480	7103	9759	7342	2844	7810	23463	7761	5625	3998	6550	19824	2670	8619	6732	1709	4354	6173	5073	8104	3582	3188	5410	10099	8503	11587	4481	2395	4092	4453	1788	2600	11104	14544	8133	1319	8005	2623	8858	7976	5745	30617	6234	25900	5654	1758	4897	9446	3474	6211	4870	17136	4143	4151	7015	4003	6031	5820	64996	12516	3748	15322	9772	2520	8788	5702	2670	7971	3831	2771	4785	4113	6910	8580	6220	410	3502	1421	8298	2629	1948	12579	1431	7856	2332	4952	3531	2974	6246	4114
6	LOC654342	894	1381	605	314	688	734	821	1010	2007	895	666	195	631	463	514	359	434	1191	196	695	279	537	287	629	2082	405	398	2959	300	1025	496	1790	395	151	755	930	276	2359	1088	362	1746	868	492	334	765	1377	483	780	409	570	1684	1071	1087	668	1895	344	1653	513	610	339	819	505	492	425	410	514	297	1355	239	624	585	480	319	578	1270	1335	755	401	485	501	186	648	665	383	374	328	270	914	253	522	552	465	354	318	928	301	824	328	301	711	204	299	426	586	1053	640	903	309	661	650	657	393	230	3021	237	1467	887	1878	1027	1212	453	1115	1176	1469	866	476	250	1428	1478	762	1022	535	173	332	442	345	2471	1128	1195	850	2058	479	935	447	1225	600	908	402	2608	255	394	783	468	303	3686	616	3225	775	559	551	1102	958	689	623	946	489	589	400	476	313	280	317	928	841	2401	531	261	2076	727	560	394	1334	299	671	492	328	530	657	547	351	289	393	2981	948	1231	712	393	1370	693	2159	764	933	771	178	573	1033	1464	399	1026	1152	896	240	281	1272	1291	306	361	309	571	156	257	776	373	891	307	524	1770	165	297	437	189	256	407	463	715	3714	374	543	687	920	814	851	153	703	596	376	323	2463	468	1406	1055	419	273	220	1060	172	664	464	1089	529	873	298	171	356	229	483	206	3358	539	667	182	613	260	1568	215	237	198	485	405	368	455	306	303	709	1617	207	479	386	453	470	470	208	390	604	1171	263	151	844	597	447	331	136	256	1344	1190	190	1344	252	927	815	1113	986	516	748	1791	1930	1989	3911	399	256	1638	800	908	913	355	1016	495	1179	410	656	544	3518	975	533	243	1231	342	666	617	304	2221	641	298	628	594	917	1545	469	297	709	3357	428	2056	2202	1862	851	3830	382	262	1244	552	493	260	393	298	523	1785	308	1040	348	1017	506	418	743	389	349	316	559	947	50	296	393	829	419	477	466	202	387	595	799	907	266	589	617	723	574	918	1118	679	879	210	639	1138	293	71	220	1347	740	414	335	301	246	441	568	663
7	AMIGO3	347	217	294	494	405	184	193	465	103	305	297	375	139	190	696	383	120	269	334	973	430	487	277	369	294	177	214	272	187	477	525	139	259	428	101	118	279	122	89	163	163	204	299	467	398	170	306	102	216	247	269	307	234	301	554	367	212	221	1112	585	170	112	303	80	181	324	6234	285	328	141	197	254	760	306	122	271	233	98	466	421	286	166	100	222	233	472	170	170	203	636	97	317	222	122	190	174	231	257	433	330	421	187	432	178	652	145	508	169	1078	192	243	343	183	228	203	283	481	84	1000	192	137	123	144	200	255	232	384	150	372	157	198	152	582	245	312	596	486	253	111	293	523	226	122	158	240	207	237	387	83	406	255	145	349	231	369	777	648	193	294	182	160	241	215	466	749	215	400	138	609	241	353	452	152	146	246	323	402	632	179	507	866	185	351	391	261	309	360	280	294	148	674	287	199	80	322	323	361	85	187	412	334	477	229	393	85	132	171	254	223	187	258	91	245	275	192	515	231	351	753	527	462	165	662	285	302	491	98	198	307	317	382	495	195	326	918	212	209	386	1112	180	165	139	291	140	227	549	250	227	416	261	385	210	385	353	428	183	120	484	330	357	132	373	943	163	245	260	272	245	388	196	205	446	406	175	285	416	724	311	347	838	568	426	750	207	241	211	2036	495	469	858	150	385	938	234	293	684	584	361	258	483	152	649	319	348	145	428	240	1031	756	372	132	809	481	348	117	153	89	214	354	238	238	217	330	406	319	259	357	221	374	371	284	150	240	1099	299	102	247	129	249	409	128	210	331	146	103	218	254	321	485	232	156	441	272	370	862	479	543	345	154	494	451	475	298	305	452	635	514	503	1377	857	769	677	210	560	384	967	432	400	285	1348	435	587	246	231	388	842	597	571	187	557	399	435	666	631	339	775	257	750	134	338	380	365	878	587	1122	943	341	1264	176	1673	735	388	336	131	326
8	TTC5	546	435	532	677	428	482	334	375	708	460	489	535	383	418	521	866	628	679	628	583	695	500	340	470	385	487	482	321	499	499	715	323	490	684	385	356	447	258	284	431	446	472	282	464	304	469	444	283	488	463	412	580	483	604	365	357	619	395	659	650	288	641	537	280	344	615	1350	377	648	312	516	508	328	817	391	584	304	368	495	409	379	535	533	521	440	809	424	298	1446	398	415	480	581	403	338	513	404	487	705	312	713	606	589	285	345	346	432	593	579	470	516	640	480	358	234	339	513	229	685	329	390	338	494	500	338	315	730	285	452	220	459	227	257	705	378	505	663	313	380	507	359	699	328	157	311	388	222	564	423	691	339	341	949	584	540	281	465	867	372	321	314	627	401	514	182	294	822	508	363	544	528	634	475	357	599	455	657	854	747	351	682	428	511	590	448	413	483	485	382	209	340	504	498	462	571	576	512	718	488	465	847	509	367	622	442	403	347	675	419	501	458	890	473	515	507	420	498	334	327	409	499	420	807	351	612	661	608	523	541	482	620	657	642	376	585	744	600	478	718	297	242	329	517	352	713	554	461	499	309	269	296	587	490	462	453	327	417	473	240	547	181	357	411	282	624	484	596	748	756	453	441	385	569	741	906	481	575	432	511	409	682	599	712	622	135	327	309	375	605	395	513	636	469	527	340	932	375	628	481	551	306	711	356	425	337	323	363	508	396	536	311	165	730	555	430	686	786	166	334	439	707	530	334	339	342	422	570	599	316	181	463	794	304	695	302	243	657	257	335	344	763	329	542	250	269	208	234	415	442	419	377	520	332	465	469	1135	583	518	679	749	497	530	326	593	218	356	519	389	186	464	794	559	563	679	429	349	337	388	623	519	564	555	311	529	853	673	742	1092	344	725	742	424	655	470	266	338	383	594	391	836	621	298	539	631	1022	583	418	479	588	266	483	429	413	321	335
9	PCOLCE2	3	32	153	19	6	13	455	60	127	1	171	107	50	209	197	4	609	36	14	1596	165	65	23	110	46	58	41	35	19	298	23	176	217	84	151	168	121	26	49	93	126	1453	55	332	776	21	46	61	45	90	22	9	4	12	11	16	9	33	1138	59	65	15	449	242	13	205	97	6	85	39	108	11	55	55	86	1153	3	158	6	73	30	243	64	179	207	0	311	339	19	3	109	58	0	330	26	4	1	8	93	18	0	88	6	54	2	1464	19	26	178	82	23	20	107	16	315	46	32	205	11	3	30	755	33	425	231	81	18	26	9	284	5	35	228	53	4	725	11	41	115	33	54	0	196	66	264	308	37	402	41	601	56	31	0	77	0	1	143	35	82	229	26	159	362	18	2	11	26	109	6	14	40	0	89	28	865	73	308	21	45	38	130	25	104	190	334	155	8	52	6	28	6	18	2	83	22	100	12	256	105	235	70	37	25	39	11	49	187	42	66	329	3	302	343	7	1	26	35	108	91	46	7	28	1	46	86	15	66	24	7	39	0	0	21	2	91	18	332	56	295	4	13	713	68	49	86	0	4	2	15	129	82	92	15	12	24	198	34	11	25	15	113	1	81	124	7	21	0	55	26	374	0	420	1	0	27	3	0	63	4	12	0	22	27	22	3	103	33	195	0	0	376	0	92	0	271	0	5	58	22	17	29	2	56	268	2	190	278	213	12	21	24	4	11	33	12	30	244	117	136	5	272	168	8	7	17	23	62	302	117	46	87	54	21	13	261	24	0	17	1	0	188	15	10	91	264	31	90	4	55	82	31	5	6	94	27	115	178	2	131	0	12	76	10	20	5	1	41	1	1	71	487	8	9	94	62	159	0	9	41	3	4	98	41	274	0	2	6	0	9	99	88	6	32	102	8	7	108	0	348	1	50	13	7	234	59	12	0	27	332	143	0	10	20	14	5
10	COPS7A	1696	2906	3054	2881	2730	2259	3158	3289	2544	2861	2493	2076	3114	3147	1902	2159	3599	2279	1946	4063	2757	2945	1855	2601	1272	3813	2960	3010	3123	3365	2557	1869	3729	2223	1974	3041	2034	3030	3164	2372	2780	2452	2582	2118	2850	5412	2789	3156	3001	1961	2978	2715	2375	2490	2378	2245	2278	2212	3045	1512	3821	2648	2133	2405	3210	3629	2097	2257	2661	2127	1640	2036	2922	2457	2406	1983	2745	2768	2677	2421	2690	3057	2644	3349	2205	2251	1665	3131	6448	1514	2558	2342	2666	2473	2348	2601	1456	2799	2187	2272	1945	2036	1881	2588	3012	2608	1434	2230	1621	1958	1679	1715	4149	2034	2408	2632	2192	3503	3766	4663	2684	3291	2222	3355	3060	3429	2080	2736	4931	3231	2157	3403	2405	2516	1847	1643	1371	2100	3941	2889	2728	2566	3706	3022	2485	2548	2470	4148	2280	2996	2742	3443	2569	2415	2563	2701	2857	2781	2897	2793	3128	4637	2521	3643	1670	2659	2044	2509	2156	2189	2754	2563	2735	2762	2799	2945	2548	5825	2467	3311	3853	2853	1781	2755	2313	2853	2777	3956	2950	2702	2403	3291	3239	3018	2026	2890	2086	3641	4707	2223	2279	1601	2186	2212	2892	2908	2799	3203	3720	2606	2630	5227	2719	3022	2463	3099	1946	1925	3481	1929	2246	1890	2047	1661	2313	2147	2844	2560	1581	2312	3011	2452	3318	2304	2088	3450	2525	2125	2526	5111	3583	3375	5251	1552	5721	1609	1882	1558	1850	4155	4648	3832	2410	2150	2170	2333	2386	3414	2249	2416	3088	2347	2741	2079	2289	2816	2165	1483	1501	2194	3004	2645	2813	4735	2455	1817	1889	2388	2749	2619	1894	2113	2740	4889	4200	2914	2334	1932	2177	1982	2651	2799	2991	2693	2023	2576	2113	1630	1943	3303	2534	1727	1880	3552	2851	3720	2675	3052	1879	3240	2208	1556	1768	2804	2716	2159	2361	2262	3302	2110	1336	2165	2443	3319	2244	1926	1812	2324	1544	1558	3203	4061	2992	3879	2367	2634	2229	6055	2697	1825	3374	2006	1934	3555	3617	2556	2751	2205	2844	3682	2387	3019	2664	6706	1777	4099	2108	3086	2327	2508	2542	4770	2595	1702	3052	2740	2180	2136	1744	1905	4538	1880	1820	2566	2248	4564	2435	3144	2295	2381	2205	1705	2562	1507	1370	1841	2657	1448	3049	2292	2005	1529	2046	2301	2587	1767	1851	3316	4184	1660	3551	2866	3510	3157	2648	3959	1985	1791	3113	2779	1986	2212	4029	2248	2323

Showing 1 to 10 of 33 entries

Previous1 2 3 4Next

9.2.2 Heatmap

Now, Let’s try make a heatmap of all patients and do both row and column clustering.

h.genelist<-genelist
h.genelist<-t(h.genelist)
colnames(h.genelist)<-h.genelist[1,]
h.genelist<-h.genelist[-1,]

# remove 0 
h.genelist[h.genelist==0] <- NA
h.genelist<-h.genelist[complete.cases(h.genelist),]



m.genelist<-matrix(as.numeric(h.genelist),
                   ncol=ncol(h.genelist))
colnames(m.genelist)<-colnames(h.genelist)
rownames(m.genelist)<-rownames(m.genelist)

m.genelist[m.genelist==0] <- NA
m.genelist<-m.genelist[complete.cases(m.genelist),]

m.genelist<-log(m.genelist)

library(pheatmap)
library(viridis)

cal_z_score <- function(x){
  (x - mean(x)) / sd(x)
}

data_subset_norm <- apply(m.genelist, 2, cal_z_score)
data_subset_norm[data_subset_norm < -2] = -2
data_subset_norm[data_subset_norm > 2] = 2

pheatmap::pheatmap(t(data_subset_norm),
         border_color = 'white')

df.genelist<-as.data.frame(m.genelist)

#save the heatmap
png('heatmap prmt shrec stad.png',
    width=1800,height=600,res=150)
dev.off()

## png 
##   2

9.2.3 Correlation

The heatmap does not look good. Probably there are some genes which are not correlated between the DEGs found in our RNAseq and patient tissues.
Hence, let’s try to make correlation matrix first

9.2.3.1 Corelation matrix

library(ggstatsplot)
ggstatsplot::ggcorrmat(
  data = df.genelist,
  type = "parametric", # parametric for Pearson, nonparametric for Spearman's correlation
  colors = c("steelblue","white","darkred"), # change default colors
  title = "Correlation matrix of DEGs",
  subtitle = "Stomach Adenocarcinoma (STAD-TCGA)",
  matrix.type ='upper',
  ggcorrplot.args = list(outline.color = "white", 
                         hc.order = TRUE, #clustering
                         pch.cex=3, # x size
                         lab_size=3.25) #label size
  
)+ggplot2::theme(aspect.ratio = 1,
                 axis.text = element_text(size=10, colour = 'black',family = 'Arial'),
                 axis.text.x= element_text(family = 'Arial',hjust =0,vjust = 1)
                 )+scale_x_discrete(position = 'top')

9.2.3.2 Correlation plot

From the plot above, we can see that PRMT1 significantly (positively) correlate with TTC5,TFB2M, MYC, C16orf91,and PTS while (negatively) correlate with ZDHHC1, AKT3, EVI5L, TP53INP2, and PTPRB.
Now we can make the correlation plot of individual patients and statistical analysis

# wide to long for positive
df.genelist %>% 
  gather('Gene','Value',c(TTC5,TFB2M,MYC, C16orf91,PTS)) %>% 
  select(Gene,Value,PRMT1) %>% 
    ggplot(aes(x=Value,y=PRMT1))+
    geom_smooth(method=lm, fullrange=FALSE,se=TRUE)+
    geom_point()+
  facet_grid(~Gene,scales = "free_x")+
    theme_Publication()+
  theme(aspect.ratio = 1,
        axis.title.x = element_blank())

# wide to long for negative
df.genelist %>% 
  gather('Gene','Value',c(ZDHHC1, AKT3, EVI5L, TP53INP2, PTPRB)) %>% 
  select(Gene,Value,PRMT1) %>% 
    ggplot(aes(x=Value,y=PRMT1))+
    geom_smooth(method=lm, fullrange=FALSE,se=TRUE)+
    geom_point()+
  facet_grid(~Gene,scales = "free_x")+
  theme_Publication()+
  theme(aspect.ratio = 1,
        axis.title.x = element_blank())

9.2.3.3 Datatable correlation

# You can check R and P value one by one like this
cor.test(df.genelist$PRMT1,df.genelist$MYC)

## 
##  Pearson's product-moment correlation
## 
## data:  df.genelist$PRMT1 and df.genelist$MYC
## t = 6.0691, df = 365, p-value = 3.224e-09
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.2067989 0.3929508
## sample estimates:
##       cor 
## 0.3027596

# or using this
library(correlation)

cor.df.genelist<-df.genelist %>% 
  select(PRMT1,TTC5,TFB2M,MYC, C16orf91,PTS,ZDHHC1, AKT3, EVI5L, TP53INP2, PTPRB)

correlation::correlation(cor.df.genelist,
  include_factors = TRUE, method = "auto"
) %>% 
  filter(Parameter1 == 'PRMT1')

## # Correlation Matrix (auto-method)
## 
## Parameter1 | Parameter2 |     r |         95% CI | t(365) |         p
## ---------------------------------------------------------------------
## PRMT1      |       TTC5 |  0.29 | [ 0.19,  0.38] |   5.74 | < .001***
## PRMT1      |      TFB2M |  0.42 | [ 0.33,  0.50] |   8.74 | < .001***
## PRMT1      |        MYC |  0.30 | [ 0.21,  0.39] |   6.07 | < .001***
## PRMT1      |   C16orf91 |  0.35 | [ 0.26,  0.44] |   7.12 | < .001***
## PRMT1      |        PTS |  0.34 | [ 0.24,  0.43] |   6.87 | < .001***
## PRMT1      |     ZDHHC1 | -0.24 | [-0.33, -0.14] |  -4.63 | < .001***
## PRMT1      |       AKT3 | -0.23 | [-0.32, -0.13] |  -4.45 | < .001***
## PRMT1      |      EVI5L | -0.27 | [-0.36, -0.17] |  -5.35 | < .001***
## PRMT1      |   TP53INP2 | -0.36 | [-0.44, -0.26] |  -7.26 | < .001***
## PRMT1      |      PTPRB | -0.32 | [-0.41, -0.22] |  -6.37 | < .001***
## 
## p-value adjustment method: Holm (1979)
## Observations: 367

9.2.3.4 Selected Heatmap and Cor. Matrix

sel.df.genelist<-df.genelist %>% 
  select(PRMT1,TTC5,TFB2M,MYC,C16orf91,PTS,ZDHHC1,EVI5L,PTPRB)

ggstatsplot::ggcorrmat(
  data = sel.df.genelist,
  type = "parametric", # parametric for Pearson, nonparametric for Spearman's correlation
  colors = c("steelblue","white","darkred"), # change default colors
  title = "Correlation matrix of DEGs",
  subtitle = "Stomach Adenocarcinoma (STAD-TCGA)",
  matrix.type ='upper',
  ggcorrplot.args = list(outline.color = "white", 
                         hc.order = TRUE, #clustering
                         pch.cex=4, # x size
                         lab_size=3.25) #label size
  
)+ggplot2::theme(aspect.ratio = 1,
                 axis.text = element_text(size=10, colour = 'black',family = 'Arial'),
                 axis.text.x= element_text(family = 'Arial',hjust =0,vjust = 1)
)+scale_x_discrete(position = 'top')

##########

h.genelist<-genelist
h.genelist<-h.genelist %>% 
  filter(Gene == 'PRMT1' |
           Gene == 'TTC5'|
           Gene == 'TFB2M'|
           Gene == 'MYC'|
           Gene == 'C16orf91'|
           Gene == 'PTS'|
           Gene == 'ZDHHC1'|
           Gene == 'EVI5L' |
           Gene == 'PTPRB')

h.genelist<-t(h.genelist)
colnames(h.genelist)<-h.genelist[1,]
h.genelist<-h.genelist[-1,]

# remove 0 
h.genelist[h.genelist==0] <- NA
h.genelist<-h.genelist[complete.cases(h.genelist),]



m.genelist<-matrix(as.numeric(h.genelist),
                   ncol=ncol(h.genelist))
colnames(m.genelist)<-colnames(h.genelist)
rownames(m.genelist)<-rownames(m.genelist)

m.genelist[m.genelist==0] <- NA
m.genelist<-m.genelist[complete.cases(m.genelist),]

m.genelist<-log(m.genelist)

library(pheatmap)
library(viridis)
library(ComplexHeatmap)

cal_z_score <- function(x){
  (x - mean(x)) / sd(x)
}

data_subset_norm <- apply(m.genelist, 2, cal_z_score)
data_subset_norm[data_subset_norm < -2] = -2
data_subset_norm[data_subset_norm > 2] = 2

colmy<-colorRampPalette(c("#4DBBD5B2","white","#E64B35B2"))(50)
colmy<-paste0(colmy,'7f')

ComplexHeatmap::pheatmap(t(data_subset_norm),
                         show_colnames = F,
                         color = colmy,
                         #row_title = "Genes", row_title_rot = 0,
                         column_title = "Patients",
                         heatmap_legend_param = list(title = gt_render("<span style='color:black'>*z-score*</span>")))

PRMT1 RNAseq recovery

Nur Aziz

2022-07-14

1 Principle

2 Preparation

3 Load RNAseq results

4 Threshold filtering (DEGs)

4.1 Scatter plot

5 Assigning genes

5.0.1 Venn diagram

6 Scenario 1 (Ideal)

6.1 Positively regulated by PRMT1

6.1.1 Make venn only positive

6.1.2 Datatable overlap positive

6.1.3 Enrichment analysis

6.2 Negatively regulated by PRMT1

6.2.1 Make venn only negative

6.2.2 Datatable overlap negative

6.2.3 Enrichment analysis

7 Scenario 2

7.1 Knockdown

7.1.1 Compare using venn diagram

7.1.2 Datatable overlap

7.1.3 Enrichment analysis (Positive)

7.1.4 Enrichment analysis (negative)

7.2 Recovery

7.2.1 Datatable

7.2.2 Enrichment (Positive)

7.2.3 Enrichment (Negative)

8 Scenario 3

8.1 Make venn

8.1.1 Datatable

8.1.2 Enrichment (Positive)

8.1.3 Enrichment (Negative)

9 Conclusion

9.1 KEGG term selected

9.2 Connecting with clinical specimen

9.2.1 Gene filtering

9.2.2 Heatmap

9.2.3 Correlation

9.2.3.1 Corelation matrix

9.2.3.2 Correlation plot

9.2.3.3 Datatable correlation

9.2.3.4 Selected Heatmap and Cor. Matrix