项目经验示例

一,期中项目经验示例

1,根据现有结构部署工具(PXE+kickstart)
2,结合应用系统需求定制部署模版
3,制作系统优化等一键执行脚本
4,自动化部署实施
5,根据定制的优化内容对自动化部署效果进行检验

1,在新批量部署的服务器上部署LNMP环境;
2,对批量化部署的环境进行效果检验;
3,编制Nginx配置文件并批量化部署;
4,根据需求做Nginx服务相关的优化(expires/gizp等)

需求:解决网站web服务器单点故障的问题

职责:
1,研究多种负载均衡方案
主要针对lvs+keepalived及nginx+keepalived进行研究
2,编写新架构方案实施项目书与实施日程
3,新系统部署与日常维护
把公司原来的多数单点服务器变成了集群,提升了网站的稳定性与高并发的应用场景

需求:解决公司root权限泛滥问题

职责:

1,提出权限整改解决方案,改进公司root权限泛滥的现状
2,召集大家开会商讨并确定方案后推进实施
3,实施后使得公司的权限管理更加清晰了(总结维护),从根本上降低了内部操作等不规范及安全隐患的发生。

问题1:你们公司是如何来管理用户权限的?
答:我们是通过sudo来管理权限的,不论是运维还是开发,一般都不会给root权限,只有核心级开发或者研发总监或以上级别的我们才可能给相应服务器级别的权限;对核心运维或者运维总监才会给root权限

问题2:在规划服务器的时候,在服务器上都跑几个普通用户?
答:我们的普通用户是根据项目来的,在不同公司它的项目产品线不一样。我们公司只有十几个产品线,我们为每一个项目建立一个普通用户,因此不论nginx还是tomcat都是跑在普通用户下。

问题3:那一些公用服务呢?比如memcached或者redis。
答:这些公共服务也可以跑在普通用户下,总的来说是这样的,我对运维的理解是,运维做运维的事情,开发做开发的事情。运维负责网络系统,只要系统没有故障,只要网络没有故障,只要系统资源还够用,那么我们运维的职责就到位了。而我们公司的理念是项目负责制,也就是说每个项目的责任人是开发,我们运维大概占30%-40%的责任。我们的开发占60%的责任。当进程上线的时候,这个服务是由普通用户跑的。它的每个站点目录都是普通用户的权限,也就是700的权限普通用户,这个是最安全的。无论是项目的启动,停止,以及代码上线,日志收集,日志分析都是通过我们进程跑的普通用户实现的。我们在管理这个项目的时候,我们可以把开发的用户加到这个项目组里面,这样负责相应项目的开发人员就有对应项目的所有权限。

1,权限控制后进一步实施对所有用户日志记录方案
2,通过sudo和rsyslog配合实现对所有用户进行日志审计并将记录集中管理
3,实施后让所有运维和开发的所有执行的命令都有记录可查,杜绝了内部人员的操作安全隐患

需求:公司服务器逐渐增多,因此管理起来很麻烦,于是提出解决批量分发管理解决方案,进行全网服务器数据分发与管理

职责:

1,针对ansible分发工具及ssh key+rsync两套分发管理方案研究,最终选择简单易于维护并且强大的ssh key+rsync方案

2,找一台IDC内网服务器,作为分发机器,对固定普通用户做sshkey认证(注意不是root),需要root权限,通过sudo来控制,减少安全隐患。

3,对于分发机进行安全配置,例如,去掉外部IP,开启防火墙。实施完毕,运维管理的效率提高了很多,因此得到了公司的嘉奖。

需求:为公司数据做一个完整的备份系统

职责:

1,针对公司重要数据备份混乱状态和领导提出备份全网数据解决方案
2,通过本地打包备份,然后rsync结合inotify应用把全网数据统一备份到一个固定存储服务器,然后在存储服务器上通过脚本检查并报警管理员备份结果
3,定期将IDC机房的数据备份公司的内部服务器,防止地震火灾等问题导致的数据丢失。

1,在进入公司之前前任运维丢失数据,因此老大很重视数据安全这方面
2,我提出并上线了MySQL数据库备份方案和MySQL架构方案
3,方案主要是在从库上开启binlog及按天分库分表全备,推送到备份服务器
4,将备份的数据定期恢复到测试库给开发使用
5,制定人工更新数据库的流程及制度

1,公司使用LNMP架构,优化较少,运行效果不佳
2,我提出了LNMP架构的优化方案
3,方案主要是Linux系统优化,nginx服务优化,php服务优化,MySQL优化
4,优化完成后,LNMP架构性能有很大提高。

需求:到公司后,没有任何监控系统,每次故障无法报警,每次故障对公司的网站都造成了很大的影响,因此我用自己已经掌握的监控技术,以及查询资料撰写解决方案,提交给公司领导,以改善服务器报警不及时的问题,最大限度的保证公司网站故障及时处理

职责:

1,根据需求选定最流行的监控软件zabbix进行研究。
2,根据不同服务器具体需求定制模版进行监控实时报警

实施完毕后,做到了大部分的故障报警都能及时有效的汇报给管理员,为网站的稳定争取了时间

起止时间: 2016/03-2016/04
软件环境: CentOS6.5
开发工具: jumpserver
项目描述:在投入工作的几个月里,我发现公司的服务器运维管理中对于服务器账号的管理十分混乱,有的运维甚至有好几个工作账号,而且能随时登陆root账户。因此,每当有运维工作人员调岗或离职,服务器的所有账户密码都会被重新改变一次,不仅费时费力,密码也不好记忆,十分的麻烦。于是,几经思考,我向领导建议启用开源型的跳板机jumpserver来改善目前混乱的状况。
项目职责:

如期中架构图

如期中架构图

需求:减轻访问高峰阶段存储压力
职责:
1,Web前端存储使用NFS主备结构
2,用户写入数据,如图片,附件等,存储到NFS主上面,用户的读访问NFS备
3,NFS主备,使用rsync+inotify进行数据同步
4,NFS存储数据量不大,采用sersync把数据推送到web前端,尽量较少前端服务访问后端服务器的请求,减轻NFS存储压力
5,数据备份的安全有了保障,不用担心数据的丢失。

二,期末项目经验示例

项目需求:

     该项目主要实现的是航天一院内部服务平台搭建 目标是搭建一个安全、高效、稳定服务器群集架构。提供航天各院的服务综合平台。

项目实施:

  • 前段采用负载均衡搭配Squid集群、搭配硬件防火墙,隔离内网与外网,并且能提供监控网络和记录传输信息的功能,加强局域网的安全性等.实现前端调度服务器的高可用、中间web服务器的负载均衡、后端数据库服务器的高可用、监控服务器监控集群中的每一台服务器的私有数据和公有数据前端调度服务器采用的软件是Keepalived和Nginx,中间Web服务器采用的软件是Nginx,并发数高,而且相对稳定
  • 后端数据库服务器采用的是读写分离,写库MySQL+MHA 双主互为主从模式。读从库使用负载均衡LVS+Keepalived+MySQL , 并使用Memcached缓存集群缓存从数据库.Web服务器采用Nginx来搭建网站服务器,并结合Inotify+Rsync实现网站数据同步.

  • 监控服务器采用的是Zabbix,监控各服务器的运行状态及服务状态。
    责任描述:
    本人在此项目中主要负责服务器服务平台的搭建,为了实现统一性,特编写了shell脚本,使得服务器部署更加标准化

需求分析:
1、 原共享存储服务器NFS的方式、存在性能瓶颈和单点故障的问题
2、 主NFS存储系统宕机后,报警管理员来人为手工根据同步的日志记录选择最快的NFS存储系统改为主,方案简单可行,但是需要人工处理.难免操作失误或者时间过长。
解决方案:
1、 使用分布式文件存储管理系统MFS替换NFS
2、 目前MFS元数据服务器存在单点问题,因此我们通过DRBD提供磁盘及时同步,通过HeartBeat提供Failover,来达到高可用
3、采用MFS+DRBD+Heartbeat高可用服务解决方案,这个解决方案可以有效解决主MFS存储系统单点的问题,当主MFS存储宕机后,可以实现把主MFS存储系统从一个主节点切换到另外一个备节点,而新的主MFS存储系统还会自动和所有其他的从MFS存储系统进行同步,且新主MFS存储系统的数据和宕机瞬间的主MFS存储系统几乎完全一致,这个切换过程完全是自动进行的,从而实现了MFS存储系统的热备方案. 快速故障恢复,提高业务可靠性.

责任描述:
本人在此项目中主要负责,项目现场协调,所有服务器服务平台的搭建,编写了shell脚本,使得服务器部署更加标准化

需求分析:
1、 新方案保证服务性能和I/O满足企业多台终端的快速响应需求。
2、 保证系统长期不间断的稳定运行。保证成本合理性。
3、 满足数据库系统的高可用性和可靠性。
解决方案:
1、 底层5台MySQL 数据库,一主四从. 开启半同步复制.提高数据安全
2、 使用中间件Atlas 实现读写分离与读负载均衡,提高与程序端解耦。
3、 在使用两台服务器搭建LVS+Keepalived 对Atlas 服务器做负载均衡与高可用
4、 搭建一台主MHA服务器管理数据库主库热备问题.

5、 该方案极大减少服务器资源浪费,实现故障30秒切换,极大保证数据库一致性
责任描述:
主要负责所有服务器服务平台的搭建,方案设计,编写脚本。

软件环境:Centos6.8
硬件环境:DELL R710
实施时间:2015年3月
刚进公司不久,后端的NFS服务器在网络请求的高峰期,偶尔会宕机,使WEB服务器的挂载请求无法自动切换到备份服务器,导致web服务器无法正常使用,造成网络服务中止。公司领导为了避免以后出现类似的情况要求我做一个解决方案。通过对NFS服务器CPU和内存的负载情况进行观察,以及对NFS服务器之前的主要硬件的负载数据进行查询,并进行仔细分析,我提交了一份以DRBD+heartbeat+NFS的方案来解决现有问题,得到领导的批准由我来实施这个方案。
项目职责:1、负责项目的整体规划和部署;
2、负责heartbeat自动切换脚本的编写;
3、负责NFS服务搭架的主要框架的搭架;
4、通过对故障的模拟,和对元数据服务器、数据存储服务器运行数据的观察,和之前的情况进行数据比较,形成报告;
5、项目实施报告的撰写。
后期改善:
通过配置多条独立的物理连接,以避免Heartbeat通信线路本身存在的单点故障,尽量地减少”脑裂”的发生机会。通过对ha.cf配置文件中,keepalive等选项的设置,来缩短主从服务器的切换时间。在DRBD中,对replication进程进行调整。处理Master端的坏块问题。

 运行环境:CentOS-6.6、DELL R730
 主要功能:分离移动端与PC业务
 运用技术:Nginx七层负载、tomcat8+jdk1.8、MHA实现mysql高可用(mysql–5.6.17)、
php-5.6.30、shell脚本发送数据检测信息
 技术要点:

1、系统环境:CentOS6.5
2、软件工具:squid-3.0
3、项目描述:
之前公司使用的是SNAT上网,造成员工在工作期间利用公司网络带宽浏览与工作无
关的网站视频,导致工作效率降低;迅雷、P2P等应用的泛滥,导致网络拥堵,企业
网带宽资源紧张。
4、职责:
a) 使用squid代理服务对公司员工的上网行为进行管控;
b) 拟定企业上网行为管控方案;
c) 实现对内网的安全防控功能,过滤恶意网页,防范恶意攻击;
d) 限制网络行为,对迅雷、P2P等下载软件进行智能控制;
e) 对上网行为进行精细智能管理。
5、项目成果:
项目实施完毕后,员工工作效率明显提升,保障了企业网带宽资源。

Original: https://www.cnblogs.com/xiaofengzheng/p/13168798.html
Author: 小风筝666
Title: 项目经验示例

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/582121/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • KindEditor配置和使用

    1下载kindeditor包,目前最新版本是kindeditor-3.5.5。下载地址:http://www.kindsoft.net/ 2.解压之后,解压目录kindeditor…

    Linux 2023年6月13日
    0108
  • 如何分析redis中的慢查询

    慢查询只记录命令执行时间,并不包括命令排队和网络传输时间。因此客户端执行命令的时间会大于命令实际执行时间。因为命令执行排队机制,慢查询会导致其他命令级联阻塞,因此当客户端出现请求超…

    Linux 2023年5月28日
    097
  • QT获取linux下的当前用户名

    故事背景:客户端启动的时候需要加载机器/home/xx/test.jpg的图片作为背景图,但是有的机器用户名叫AAA,有的机器名叫BBB,所以我需要获取当前用户的home目录 技术…

    Linux 2023年6月13日
    0118
  • ajax的发展

    ajax(Asynchronous Javascript and XML)异步javascrip和XMl. ajax只是一种web交互方法。在客户端(浏览器)和服务区段之间传输少量…

    Linux 2023年6月13日
    089
  • WPF 多线程下跨线程处理 ObservableCollection 数据

    本文告诉大家几个不同的方法在 WPF 里,使用多线程修改或创建 ObservableCollection 列表的数据 需要明确的是 WPF 框架下,非 UI 线程直接或间接访问 U…

    Linux 2023年6月6日
    0104
  • lvs

    1.lvs简介 2.结构体系 3.lvs工作模式及原理 4.配置lvs 4.1 部署lvs-nat模式的httpd负载集群—http协议 4.2 部署lvs-dr模式的…

    Linux 2023年6月13日
    099
  • 相关powerLink教程、配置方法等

    openPowerLink的开发小组早已经解散,所以有些资料都可以在官网上下载到; 这也是最后一次更新了。其中相关powerlink的教程均放在百度网盘里,链接:https://p…

    Linux 2023年6月14日
    0115
  • Jenkins,8080端口无法修改问题

    今天安装了 Jenkins 。想把8080 端口修改为 6699 。 出现以下状况。 一:找到 jenkins.xml 文件。 vi /usr/lib/firewalld/serv…

    Linux 2023年6月13日
    093
  • Redis下载及安装(windows版)

    Redis下载及安装(windows版) 下载地址1、Github下载地址:https://github.com/MicrosoftArchive/redis/releases2、…

    Linux 2023年5月28日
    097
  • mycat数据库集群系列之mycat读写分离安装配置

    最近在梳理数据库集群的相关操作,现在花点时间整理一下关于mysql数据库集群的操作总结,恰好你又在看这一块,供一份参考。本次系列终结大概包括以下内容:多数据库安装、mycat部署安…

    Linux 2023年6月14日
    0136
  • 进程

    理论知识 操作系统背景知识 顾名思义,进程即正在执行的一个过程。进程是对正在运行程序的一个抽象。 进程的概念起源于操作系统,是操作系统最核心的概念,也是操作系统提供的最古老也是最重…

    Linux 2023年6月14日
    0101
  • Android中的Coroutine协程原理详解

    前言 协程是一个并发方案。也是一种思想。 传统意义上的协程是单线程的,面对io密集型任务他的内存消耗更少,进而效率高。但是面对计算密集型的任务不如多线程并行运算效率高。 不同的语言…

    Linux 2023年6月13日
    0108
  • GDT表实现

    GDT是保护模式下的内存段登记表。 段界限计算 段界限用 20 个二进制位来表示。只不过此段界限只是个单位量,它的单位要么是字节,要么是 4K,这是由描述符中的G位来指 定的。由于…

    Linux 2023年6月7日
    089
  • python实现Mysql数据库批量新增数据

    一、批量插入数据的场景 二、插入数据的工具选择 三、选择Python进行批量插入 Python实现批量插入Mysql数据库数据 一、批量插入数据的场景 在进行数据压力时需要进行大数…

    Linux 2023年6月14日
    089
  • Redis阻塞操作实现原理(转)

    原文:https://www.jianshu.com/p/xsMzfn 作者:Haiger 最近一位朋友问到:既然Redis是单线程的工作模式,那像 _BLPOP_这样的阻塞操作又…

    Linux 2023年5月28日
    0104
  • 【Jmeter】jmeter提取response中的返回值,并保存到本地文件–BeanShell后置处理器

    有个需求,需要在压测环境中,创建几十万的账号数据,然后再根据创建结果,查询到某些账号信息。 按照之前我的做法,直接Python调用API,然后再数据库查询; 但是近期所有开发人员的…

    Linux 2023年5月28日
    098
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球