2022 07-09 历时三年,苏宁如何建设多数据中心多活的实践项目? 作者 | 陈跃泉、涂成义、马忠成策划 | 蔡芳芳随着苏宁线下线上业务以及全产业、全业态规模式快速增长,特别是每年苏宁 818 大促、双 11 等大促节点,销售订单基本都呈现倍数级增长态势,需要进行大量资源扩容,单个数据中心的容量有限,已经无法支撑苏宁业务的快速发展。同时,单数据中心在高可用上存在不足,一旦数据中心发生故障,会导致业务受损,用户访问中断,带来严重的影响。针对以上问题,苏...阅读全文... 阅 读 全 部 >
2022 07-09 多机房多活架构,究竟怎么玩? 前情提要:《 当年,我们是怎么平滑上云的? 》一文中提到了上云的背景,将所有的系统,从一个机房,迁移到另一个机房。 如上图:迁移之前,系统部署在机房A(M6)内,是单机房架构。迁移之后,系统部署在机房B(阿里云)内,换了一个机房。《当年,我们是怎么平滑上云的? 》有三结论:(1)单机房架构的核心是“全连接”;(2)机房迁移方案的设计目标是:平滑迁移,不停服务;可以分批迁移;随时可以回滚;(3)想要... 阅 读 全 部 >
2022 07-08 dplyr包-行选择的方法 《R包学习》专栏·第3篇 文| R学习者2352字 | 6分钟阅读这是dplyr包系列第三篇文章。前两篇文章如下:前两篇文章是从 数据列的角度做选择和变换处理。这篇文章是从 数据行的角度,描写行选择的一系列操作与方法。数据的行,可以看作为 观察、样例、对象等。 数据的行选择,主要包括如下内容:1 基于比较运算的行选择2 基于字符匹配的行选择3 基于正则模式的行选择4 基于多条件的行选择5 跨越多列... 阅 读 全 部 >
2022 07-08 R语言颜色综合运用与色彩方案共享 转自:EasyCharts今天这篇主要讲解R语言颜色综合运用,主要跟大家介绍如何提取那些专业色彩包中的颜色搭配用于在基础绘图系统和高级绘图系统中共享。其实无论是R语言的预设配色系统、自定义颜色表还是哪些专属配色包,我们所使用(或者R语言识别的)的仅仅就是一组字符向量所代表的色值而已,并不神秘。通过scales中的色彩获取函数,我们可以将专属配色主题(RColorBrewer、ggthemes)中的... 阅 读 全 部 >
2022 07-08 组间基因表达值-蜂群图的绘制(R教程) 在文献中,我们经常能够看到这样的散点图。例如,通过RNA-seq或qPCR比较特定基因在不同分组样本中的整体表达水平。文献中的蜂群图与其称它们为散点图,其实它们是有独自名字的—蜂群图。当然原则上它们仍属于散点图的范畴,因为它仍将单个样本直接显示为点。但其特别之处在于,蜂群图采用了一种逻辑,以确保所绘制的点彼此靠近且不会重叠,并能有效呈现出点分布的局部密度信息,直观而不失优雅。...阅读全文>... 阅 读 全 部 >
2022 07-08 Python科研统计作图Plotnine+Seaborn+matplotlib替代R ggplot2系列(一) Python作为胶水语言的强大之处已经不需要我过多描述了,它在机器学习领域、大型网站搭建框架等都有非常广泛的应用,比如TensorFlow的python接口,基于Python的Tornado和Django框架,国内的知乎和豆瓣、以及Youtube大部分是基于这些python的框架。当然最为重要的是它在生物信息领域的应用也较为广泛,比如基于扩增子的测序,还有一些全基因组测序等后期分析的软件很多都是基... 阅 读 全 部 >
2022 07-08 实习僧招聘网爬虫数据可视化 我本来对实习僧网站是没什么好感的,因为之前自己在实习僧上投的实习简历几乎全部都石沉大海了(一个文科生偏要去投数据分析岗不碰壁才怪~_~)!然鹅看到最近知乎爬虫圈儿里的两大趋势:爬美图;爬招聘网站。后来大致观察了下,几乎各类大型招聘文章都被别人爬过了,自己再去写免不了模仿之嫌,而且大神们都是用Python去爬的(Python我刚学会装包和导数据),自己也学不来。现在只能选一个还没怎么被盯上的招聘网站... 阅 读 全 部 >
2022 07-08 科研巨佬的“万水千山图”是如何绘制的? 最近,在文献中看到这样一个令人惊艳不已的组合图,如下。很明显,这个图至少是由8个小图表组合而成的,通过坐标轴粗细和图表间隔的不一致可以看出来。可见,熟练使用Ai(Adobe illustrator)也是成为科研巨佬的必备技能。(The Plant Cell, 2020)除去两侧的聚类树和条形图,组合图的中间部分其实是一种比较新颖的山峦图,也称作山脊线图(Ridgeline plots),可以用作图... 阅 读 全 部 >
2022 07-08 R 语言的高颜值的配图法则 | 论文写作 笔者前一段时间忙于为新文章制作配图,多处搜集配图优雅美观的优质论文。最后终于找到一篇发表在 Science Advances 的文章——通过高通量测序分析揭示了小 RNA 在小鼠卵母细胞和早期胚胎中的调控作用。文章中除了复杂的 RNA Seq、Chip Seq 分析,图表的搭配十分美观。虽说我们是崇高的科(ke)学 (yan) 家 (gou),但关乎我们毕业大计的 SCI 也得要「高颜值」。以常见... 阅 读 全 部 >
2022 07-08 技术专栏丨10大机器学习算法速览,带你开启AI之旅 转自:TalkingData原文作者:Sunil Ray译者:TalkingData 张永超原文链接:https://www.analyticsvidhya.com/blog/2017/09/common-machine-learning-algorithms/“简介”从广义上讲,机器学习算法有三种类型:监督学习该算法是由一个目标/结果变量(也成为因变量)组成,该变量可以从一组给定的预测...阅读... 阅 读 全 部 >