高等计算机系统结构

发布者:系统管理员发布时间:2018-12-14浏览次数:1476

研究生课程教学大纲、教学周历

课程序号:                                      院(系):计算机系

课程

名称

中文

高等计算机系统结构

英文

Advance Computer Architecture

课程编号

 

课程适用学位级别

硕士

总学时

40

课内学时

32

学分

2

实践环节

研究报告

用机小时

0

开课院(系)

计算机系

开课学期

秋季

考试方式

考查

主讲教师

教师姓名

任国林

学位

学士

博导或硕导

 

职称

副教授

学历

本科

e-mail

renguolin@seu.edu.cn

网页地址

 

授课语言

汉语

课件地址

cse.seu.edu.cn/people/renguolin/

适用学科范围

二级

适用学科名称

 

实验(案例)个数

 

先修课程

计算机系统结构

教学用书

教材名称

教材编者

出版社

出版年月

版次

主要教材

并行计算机

体系结构

陈国良等著

高等教育出版社

2002.9

 

主要

参考书

并行计算机

体系结构

David E. Culler等著

李晓明等译

机械工业出版社

2002.10

2

可扩展并行计算

黄铠、徐志伟著

陆鑫达等译

机械工业出版社

2002.5

 

 

一、教学目标和要求:

并行计算的性能与并行算法的并行性和计算机系统的并行处理能力有很大关系;如何开发计算机系统软、硬件的并行性,以适应并行计算的性能需求和规模需求是当今计算机系统的研究热点。

《高等计算机系统结构》主要是在微型计算机结构的基础上,分析并行计算机体系结构,讨论系统性能的评测及其可扩展性,以期在系统资源增长时使机器性能按比例增长。主要内容有并行计算机模型与体系结构、性能评测方法、编程模型与通信模型、互连与通信技术、共享存储与Cache一致性、分布存储与可扩展性等。

通过本课程的学习,希望学生能够从并行计算机模型、并行程序编程模型、可扩展性原理等基础理论出发,掌握并行计算机的结构原理、组成技术、互连与通信技术,为并行算法研究和并行程序设计打下坚实的基础。

 

二、教学大纲(含章节目录):

本课程主要介绍并行计算机系统的理论、结构与技术。主要内容包括并行计算机模型与体系结构、编程模型与通信系统、共享存储与Cache一致性、分布存储与可扩展性、互连网络、通信时延包容等。

    具体章节内容如下:

第一章  系统结构设计基础

    第一节 计算机系统结构概念

    第二节  系统设计的定量原理

    第三节  计算机系统性能评价

    第四节  系统结构中并行性的发展

 第二章  微处理器结构与技术

    第一节  微处理器结构

    第二节  存储系统

    第三节  标量流水技术

    第四节  指令级并行技术

 第三章  并行计算机体系结构

    第一节  并行计算机系统简介

    第二节  并行计算机体系结构

    第三节  可扩展设计原理

 第四章  性能评测

    第一节  引言

    第二节  机器级性能评测

    第三节  算法级性能评测

    第四节  程序级性能评测

    第五节  如何提高性能

 第五章  互连网络

    第一节  互连网络基本结构

    第二节  网络拓扑结构

    第三节  网络路由算法

    第四节  交换机的设计

 第六章  共享存储多处理机

    第一节  共享存储多处理机

    第二节  基于监听的Cache一致性协议

    第三节  基于监听的Cache一致性实现

    第四节  同步操作的设计与实现

 第七章  分布共享存储多处理机

    第一节  分布存储与可扩展性

    第二节  编程模型的实现

    第三节  通信辅助部件的实现

    第四节  Cache一致性的实现

    第五节  放松的存储一致性模型

    第六节  时延包容技术

 第八章  机群系统

    第一节  机群化体系结构

    第二节  单一系统映像

    第三节  作业管理

    第四节  并行文件系统

    第五节  实例分析

 

 

三、教学周历:

周次

教学内容

教学方式

1

系统结构设计基础

讲课

2

微处理器结构存储系统标量流水技术

讲课

3

指令级并行技术

讲课

4

并行计算机体系结构

讲课

5

性能评测

讲课

6

互连网络基本结构网络拓扑结构

讲课

7

网络路由算法交换机的设计

讲课

8

共享存储多处理机,基于监听的Cache一致性协议

讲课

9

基于监听的Cache一致性实现同步操作的设计与实现

讲课

10

分布存储与可扩展性,编程模型的实现通信辅助部件的实现

讲课

11

Cache一致性的实现

讲课

12

放松的存储一致性模型,时延包容技术

讲课

13

机群系统

讲课

 

四、主讲教师简介:

    任国林,男,1965年5月出生,1986年毕业于东南大学计算机科学与工程系,并留校任教,现在计算机科学与工程系系统结构教研组,副教授。主要从事计算机体系结构、嵌入式系统及其应用、控制系统及其应用、多媒体压缩与传输技术等方面的研究。主讲过《计算机系统结构》等10余门课程,发表论文10余篇,主持和参与科研项目10多项。

 

五、任课教师信息(包括主讲教师):

任课

教师

学科

(专业)

办公

电话

住宅

电话

手机

电子邮件

通讯地址

邮政

编码

任国林

计算机系统结构

83792403

83795795

13002568228

renguolin@seu.edu.cn

文昌街2号新九舍610室

210018

 

 

 

 

 

 

 

 

 


 

GraduateCourse Syllabus

Course Serial Number            School(orDepartment)Computer Science& Engineering

 

Course Title

in Chinese

高等计算机系统结构

 in English

Advance Computer Architecture

Course Number

 

Type of Degree Suitable

master

Total Hours

40

Class Hours

32

Credit

2

Practice or Experiments

Research  report

Computer-using Hours

0

Department

Computer Science & Engineering

Semester

springtime

Form of Exam

check

Chief

Lecturer

Name

Ren Guolin

Professional Title

associate professor

E-mail

renguolin@seu.edu.cn

Personal Website

 

Course Language

Chinese

Teaching Material Website

cse.seu.edu.cn/people/renguolin/

Class of Discipline

 

Title of Discipline

 

Number of Experiments

 

Preliminary Courses

Computer Architecture

Teaching Reference Books

Book Title

Author

Publishing House

Year of Publication

Edition Number

Main Textbook

Parallel Computer Architecture

Chen Guoliang

Higher Education Press

2002.9

 

Main Reference Books

Parallel  Computer Architecture

David E. Culler

China Machine Press

2002.10

2

Scalable Parallel Computing

Kai Hwang

China Machine Press

2002.5

 

 

I.  Teaching Goals andRequirements:

Performance of parallel computing hasstrong relation with parallelism of parallel arithmetic, and parallel process capabilityof parallel computer. How to exploit parallelism of software and hardware forcomputer, has become hotspot of modern computer system research, in order toadapt to performance requirement and machine size requirement with parallelcomputing.

Based on micro-computer architecture model,this course analyze mainly parallel computer architecture, discusses its evaluations of system performance and scalability, inorder to increase the rate of capability with the increasing of systemresource. The main contents include parallel computer model and architecture, evaluating method of performance, programming modeland communication model, interconnect and communication techniques, sharedmemory and Cache coherence, distributed memoryand scalability etc.

By learning the course, students can comprehendthe basic theory of parallel computer model, parallel programming model,principles of scalable etc., grasp the architecture, organization technology,interconnect and communication techniques of parallel computer, establish solidfundamentals in parallel arithmetic researching and parallel programming.

 

II. Teaching Syllabus (chapters, including sections) 

The Courses mainly introduce the theory,architecture and technique of parallelcomputer. The contents include parallel computer model and architecture,programming model and communication model, shared-memory and Cache Coherence, distributedmemory and scalabilities, interconnect network, communication latency tolerance etc.

The outline of chapter and section isas follows:

    Chapter 1  Design Foundations of Architecture

1.1Conceptions of Computer Architecture

1.2 RationPrinciples of System Design

1.3Evaluations of Performance for Computer System

1.4 Evolutionof Architecture Parallelism

    Chapter 2  Microprocessor Architectures andTechniques

       2.1Microprocessor Architectures

       2.2 MemorySystems

       2.3 Scalarand Pipeline Techniques

       2.4Parallel Techniques of Instruction Level

    Chapter 3  Parallel Computer Architectures

       3.1Parallel Computer Introduction

       3.2Parallel Computer Architectures

       3.3Principles of Scalability Design

    Chapter 4  Evaluations of Performance

       4.1Introduction

       4.2 Evaluationsof Performance for Machine Level

       4.3 Evaluationsof Performance for Arithmetic Level

       4.4 Evaluationsof Performance for Program Level

       4.5 How toAdvance Performance

    Chapter 5  Interconnection Networks

       5.1 BasicOrganizations of Interconnection Networks

       5.2Topologies of Networks

       5.3Routing Arithmetic of Networks

       5.4 Designof Switches

    Chapter 6  Shared-Memory Multiprocessors

       6.1Shared-Memory Multiprocessors

       6.2Snoopy-Based Cache Coherence Protocols

       6.3Snoopy-Based Cache Coherence Implementations

       6.4Designs and Implementations of Synchronous Operation

    Chapter 7  Distributed-Shared-MemoryMultiprocessors

       7.1Distributed-Memory and Scalabilities

       7.2 Implementationsof Programming Model

       7.3Implementations of Communication assists

       7.4Implementations of Cache Coherence

       7.5 Relaxed Memory Consistency Models

       7.6Latency tolerance Techniques

    Chapter 8  Computer Clusters

       8.1 Cluster Architectures

       8.2Single-System image

       8.3 TaskManagement

       8.4Parallel File System

       8.5Examples Analysis

 

III. Teaching Calendar

 

Week

Course Contents

Teaching Method

1

Design Foundations of Architecture

 Lecture

2

Microprocessor Architectures, Memory Systems, Scalar and Pipeline Techniques

Lecture

3

Parallel Techniques of Instruction Level

Lecture

4

Parallel Computer Architectures

Lecture

5

Evaluations of Performance

Lecture

6

Basic Organizations of Interconnection Networks, Topologies of Networks

Lecture

7

Routing Arithmetic of Networks, Design of Switches

Lecture

8

Shared-Memory Multiprocessors, Snoopy-Based Cache Coherence Protocols

Lecture

9

Snoopy-Based Cache Coherence Implementations, Designs and Implementations of Synchronous Operation

Lecture

10

Distributed-Memory and Scalabilities, Implementations of Programming Model, Implementations of Communication assists

Lecture

11

Implementations of Cache Coherence

Lecture

12

Relaxed Memory Consistency Models, Latency tolerance Techniques

Lecture

13

Computer Clusters

Lecture

Note: The teaching calendar is not compulsorytemporarily for speciality courses for doctor degree.

 

IV. Resumeof the Chief Lecturer

Ren Guolin, Male, born in May 1965, graduatedfrom computer science and engineering department, Southeast University at1986. From then on, he engages teaching and researching in here. Now, he isworking in section computer architecture qua associate professor. He’s interestis on researching of computer architecture, embedded system and its application,control system and its application, multimedia compression and transmissiontechnology, etc. He has lectured more than 10 courses concerned computer architecture,authored more than 10 papers. He has completed more than 10 projects.

 

2:新开课程请填写以上英文教学大纲,该内容将在英文网页上刊登。

 

  • 联系方式
  • 通信地址:南京市江宁区东南大学路2号东南大学九龙湖校区计算机学院
  • 邮政编码:211189
  • ​办公地点:东南大学九龙湖校区计算机楼
  • 学院微信公众号