热门搜索: 极速赛车开奖结果

步调员用Python判辨徐峥竟磋议出《我不是药神》30亿票房真正诀要

时间:2018-11-09 12:13 文章来源:未知 作者:极速赛车 点击次数:

  前段时分神驰的存在第二季中,托尼何教练给山争大叔洗头那一幕,实正在给节目赚足了乐点。

  《港囧》宣告时,山争哥另辟门途,正在宣告会上化身“徐布斯”用大数据剖释《港囧》,把观众乐声次数换算成票房收入。

  因而正在徐峥的怪异睹识中,什么样的题材、导演、艺员才是他的青睐?本文用Python爬取数据、并用R措辞举行数据可视化统治来懂得这位才子。

  起首来看看徐峥出演的片子中,评分排前10的片子名,《我不是药神》是徐峥目前评分最高的片子,这结果齐备可能算邦产片里的地步级了。又有极限挑拨和神驰的存在,徐峥举动权且嘉宾的那期节目也获得了不错的响应。

  接下来看看徐峥和哪些导演配合比力严紧?徐峥出演本人自导的片子有4次,山争年老齐备没放过本人当主演的机缘,和宁浩导演配合4次,《放肆的石头》《无人区》《心花途放》《放肆的赛车》这四部,都是不错的片子,除开配合伙伴的相闭,这该当也是徐峥采选出演片子的缘由。《我不是药神》也是宁浩监制、文牧野导演。

  再看看徐峥配合过的艺员状况,图c是和徐峥配合过的艺员作品均匀评分排名前10的艺员,图d是作品均匀评分排名后10的艺员。配合最众的艺员是黄渤,一共有9次的配合,《放肆的石头》《放肆的赛车》《无人区》《心花途放》《泰囧》等作品都获得了不错的票房和评分,然则《恋爱呼唤移动Ⅱ:恋爱驾驭》只要5.2的评分,导致黄渤没有正在这前10里,而张艺兴、孙红雷、罗志祥只和徐峥配合过一期《极限挑拨》就9.0靠前了,看来均匀值有时辰真的会掩护紧要的音讯。

  结尾再看看徐峥囧系IP片子选角的艺员人气状况,将艺员豆瓣上被保藏的次数举动人气的丈量,对照《港囧》《泰囧》《人正在囧途》的艺员人气,看来《港囧》的腐烂确实很大成分归由于选角,人气明明低于《泰囧》。

  1library(dplyr)  2library(plyr)# 这个包内中的count函数才略统计文本的个数  3library(tidyverse)  4library(ggplot2)  5library(readxl)  6library(xlsx)  7library(RColorBrewer)  8  9movie_data - read_excel(D:\\partner111.xlsx) 10# 徐峥配合伙伴评分排名前10和后10的艺员 11left_data - movie_data[movie_data$rating!=0, ]# 去掉没有评分的片子 12attach(left_data) 13ave_rate - aggregate(as.numeric(rating), by=list(par_name), FUN=mean) 14ave_rate$rate - round(ave_rate$x, 1) 15detach(left_data) 16ave_rate - ave_rate[order(ave_rate$rate), ] 17col - brewer.pal(9,Blues) 18pbbPalette - c(#FFCCCC,#FF9999,#FF6666,#FF3333,#FF0000,#CC0000,#990033,#990000,#660000,#330000) 19cbbPalette - c(#000000, #E69F00, #56B4E9, #009E73, #F0E442, #0072B2, #D55E00, #CC79A7, #FF0033, #339999) 20ggplot(data = head(ave_rate,10), aes(x = reorder(Group.1,rate,median), y = rate)) + ylim(0,10) + geom_bar(stat=identity,fill=pbbPalette) +  21  labs(title = rating of moives, x=配合艺员, y=均匀评分) 22ggplot(data = tail(ave_rate,10), aes(x = reorder(Group.1,rate,median), y = rate)) + ylim(0,10) + geom_bar(stat=identity,fill=pbbPalette) +  23  labs(title = rating of moives, x=配合艺员, y=均匀评分) 24 25# 配合的导演的作批评分 26attach(left_data) 27dir_rate - aggregate(as.numeric(rating), by=list(director), FUN=mean) 28dir_rate$rate - round(dir_rate$x, 1) 29detach(left_data) 30dir_rate - dir_rate[order(dir_rate$rate),] 31ggplot(data = head(dir_rate,15), aes(x = reorder(Group.1,x,median), y = x)) + ylim(0,10) + geom_bar(stat=identity,fill=steelblue) +  32  labs(title = rating of director, x=导演, y=均匀评分) +  33  theme(axis.text.x = element_text(size = 8, family = myFont, face = bold, vjust = 0.5, hjust = 0.5, angle = 45)) + 34  geom_text(aes(label = rate, vjust = -0.8, hjust = 0.5), show.legend = TRUE) 35ggplot(data = tail(dir_rate,15), aes(x = reorder(Group.1,x,median), y = x)) + ylim(0,10) + geom_bar(stat=identity,fill=steelblue) +  36  labs(title = rating of director, x=导演, y=均匀评分) +  37  theme(axis.text.x = element_text(size = 8, family = myFont, face = bold, vjust = 0.5, hjust = 0.5, angle = 45)) + 38  geom_text(aes(label = rate, vjust = -0.8, hjust = 0.5), show.legend = TRUE) 39 40# 配合的导演次数 41attach(left_data) 42dir_time - left_data %% select(movie_name,director) 43dir_time - dir_time[!(duplicated(left_data$movie_name)),] 44dir_table - count(dir_time$director) 45detach(left_data) 46dir_table - dir_table[order(dir_table$freq),] 47ggplot(data = dir_table[dir_table$freq=2,], aes(x = reorder(x,freq,median), y = freq)) + geom_bar(stat=identity,fill=steelblue) +  48  labs(title = times of director, x=导演, y=配合次数) +  49  theme(axis.text.x = element_text(size = 8, family = myFont, face = bold, vjust = 0.5, hjust = 0.5, angle = 45)) + 50  geom_text(aes(label = freq, vjust = -0.8, hjust = 0.5), show.legend = TRUE) 51 52# 徐峥评分排名前10的片子名 53attach(left_data) 54top_movie - aggregate(as.numeric(rating), by=list(movie_name), FUN=mean) 55detach(left_data) 56rank_moive - top_movie[order(top_movie$x), ] 57ggplot(data = tail(rank_moive,10), aes(x = reorder(Group.1,x,median), y = x))  + ylim(0,10) + geom_bar(stat=identity,fill=pbbPalette) +  58  labs(title = top10 moives, x=片子, y=评分) + 59  theme(axis.text.x = element_text(size = 8, family = myFont, face = bold,vjust = 0.7, hjust = 0.7, angle = 45)) 60 61# 囧字IP片子的艺员人气对照 62jiong - left_data[left_data$movie_name %in% c(人正在囧途,人再囧途之泰囧,港囧),] 63jiong$collection - as.numeric(jiong$collection) 64cbbPalette - c(#E69F00, #56B4E9, #009E73) 65ggplot(data = jiong, aes(x = movie_name, y = collection)) + geom_boxplot(fill=cbbPalette) +  66  labs(title = collection in the movie of jiong IP, x=艺员, y=人气) 67 68# 徐峥片子类型对照 69attach(left_data) 70agg_data - left_data %% select(movie_name,types,rating) 71agg_data - agg_data[!(duplicated(left_data$movie_name)),] 72View(agg_data) 73detach(left_data) 74li = list(笑剧,真人秀,恋爱,剧情,悬疑,脱口秀,违警,举动,惊悚,古装,奇幻,动画) 75type = c() 76ave_rating =c() 77for (i in li){ 78  type_moive - agg_data[grepl(i,agg_data$types), ] 79  ave = mean(as.double(type_moive$rating)) 80  type = c(type, i) 81  ave_rating = c(ave_rating, ave) 82} 83type_rating - data.frame(type=type, ave_rating=ave_rating) 84pbbPalette - c(#FFCCCC,#FF9999,#FF6666,#FF3333,#FF0033,#FF0000,#CC3333,#CC0000,#990033,#990000,#660000,#330000) 85ggplot(data = type_rating, aes(x = reorder(type,ave_rating,median), y = ave_rating)) + ylim(0,10) + geom_bar(stat=identity,fill=pbbPalette) +  86  labs(title = rating of types, x=类型, y=均匀评分) +  87  theme(axis.text.x = element_text(size = 8, family = myFont, face = bold, vjust = 0.5, hjust = 0.5, angle = 45)) + 88  geom_text(aes(label = round(ave_rating,1), vjust = -0.8, hjust = 0.5, color = red), show.legend = TRUE) 89 90 91library(igraph) 92#加载数据框 93attach(movie_data) 94agg_data - movie_data %% select(par_name, time) 95detach(movie_data) 96agg_data - agg_data[!(duplicated(agg_data$par_name)),] 97nrow(agg_data) 98centre - rep(徐峥,time=148) 99graph_data - data.frame(centre,agg_data)100write.xlsx(graph_data,D:\\mydata.xlsx)101all_data - read_excel(D:\\mydata.xlsx)102g - graph.data.frame(all_data)103# 徐峥的相闭汇集图104#天生图片,巨细是800*800px105jpeg(filename=D:\\GRAPH1.jpg,width=800,height=800,units=px)106plot(g,107     vertex.size=2,#节点巨细108     layout=layout.kamada.kawai,  #构造方法109     vertex.shape=none,    #不带边框el.cex=1,    #节点字体巨细or=#CC79A7,  #节点字体颜色112     edge.arrow.size=0.2)    #连线#合上图形筑设,将缓冲区中的数据写入文献114dev.off()115116# 徐峥和陶虹的相闭汇集图117# install.packages(RcolorBrewer)118library(RColorBrewer)119col - brewer.pal(9,Blues)120V(g)$label.color - #FF0033# 标签颜色创立121attach(all_data)122all_data - all_data[order(time),]123n3 - nrow(all_data[time6,])124n2 - nrow(all_data[time=3&time=6,])125n1 - nrow(all_data[time3,])126detach(all_data)127edge_col - c(rep(col[3],n1),rep(col[6],n2),rep(col[9],n3))# 边依据分别的数字创立分别深浅的颜色128V(g)$size=degree(g)/12129jpeg(filename=D:\\GRAPH2.jpg,width=1000,height=1000,units=px)130plot(g, layout = layout.fruchterman.reingold,vertex.label.cex=1,edge.color=edge_col,edge.arrow.mode=-)131dev.off()

  作家:糖甜甜甜,985高校经管研二,擅长用Python、R、tableau等用具连合统计学和机械进修模子做数据剖释。个别大众号:经管人学数据剖释(ID:DAT-2017)

极速赛车官网

    热门排行