posted by 권오성의 Biomedical Engineering 2018. 3. 30. 10:27

신뢰구간이라는 것은 말 그대로 믿을 수 있는 구간을 의미한다. 

보통 모수중에서도 모평균을 알고자 할 때 자주 쓰인다.


예를 들어 대한민국 20대 남자의 평균키를 알고 싶다고 가정했을 경우, 우리가 궁극적으로 알고 싶은 것은 우리나라의 모든 20대 남자들의 키를 조사한 다음 그 값들을 평균한 값, 즉 모평균을 알고 싶을 것입니다.

그러나, 현실적으로 모집단 전체에 대해 조사를 못하고 표본을 가지고 조사합니다. 그러므로 우리가 얻을 수 있는 값은 표본의 평균이기 때문에 모평균과 차이가 발생됩니다. 그래서 나온 것이 구간추정이고, 이것의 핵심이 바로 신뢰구간입니다.


위와 같이 해서 만약 얻어진 값이 70cm ~ 300cm 라는 구간이라면 이 구간안에는 아마 대한민국의 20대 남자들이 포함이 될 것입니다. 즉, 키가 3 m 를 넘는 남자도 없고 70 cm 보다 작은 사람도 없겠죠. 그래서 이 구간은 100% 신뢰구간이 됩니다. 즉, 이 구간안에는 모집단의 모평균이 100 % 들어있게 되는 것이죠. 

여기서 중요한 것은 구간안에 모수(모평균)가 포함되어 있을 확률을 의미합니다. 


그럼 95% 신뢰구간은 결국 그 구간안에 모수가 포함되어 있을 확률이 0.95인 95%가 될 것입니다. 좀더 정확한 개념으로 말하면 우리는 하나의 표본의 구해서 어떤 신뢰구간을 구할 것입니다. 그 구간은 a1 ~ b1 이라고 하면 이 구간안에 모수가 포함이 되어 있을 수도 있고 포함이 되지 않을 수도 있습니다. 마찬가지 방법으로 똑같은 모집단에서 같은 방법으로 또다른 표본을 추출하고 그 표본에서도 어떤 신뢰구간을 구합니다. 그 구간을 a2 ~ b2 라고 하면 역시 이 구간에도 모수가 포함이 될 수도 아닐 수도 있습니다.

위와 같은 방법으로 100 개의 표본을 뽑는다면 각 표본마다 구간이 나올 것입니다.


             a1    ~ b1

             a2    ~ b2

             a3    ~ b3

              :         :

              :         :

             a100 ~ b100


위와 같이 구간이 100 개가 나오고 이 구간들은 서로 다를 것입니다. 또한 그 구간안에 모수가 포함될 수도 아닐 수도 있습니다. 여기에서 최소한 모수가 포함된 구간이 95개 있을 경우에 이 구간을 95% 신뢰구간이라고 합니다. 좀더 정확히 말하면 신뢰수준이 95%인 신뢰구간이다라고 말합니다.


그러므로, 신뢰구간과 신뢰수준은 서로 비슷한 용어이면서 공생하는 개념입니다. 신뢰수준은 믿을 수 있는 정도를 의미하고 신뢰구간은 신뢰수준에 바탕을 둔 어떤 모수의 믿을 수 있는 구간을 의미하는 것입니다.


펌 : http://www.statedu.com/?document_srl=7360&mid=term&sort_index=readed_count&order_type=desc


posted by 권오성의 Biomedical Engineering 2014. 8. 30. 14:47
gnome에서 제공하는 이미지뷰어 프로그램 : eog
gnome데스크톱기반의 movie player : totem
pdf문서 프로그램 : evince
posted by 권오성의 Biomedical Engineering 2014. 8. 22. 14:27

-리듀스(Map-Reduce)는 구글이 분산 컴퓨팅을 지원하기 위한 목적으로 제작하여, 2004년 발표한 소프트웨어 프레임워크입니다. 이 프레임워크는 대용량 데이터를 신뢰할 수 없는 컴퓨터로 구성된 분산 클러스터 환경에서 대규모 데이터를 병렬로 처리하기 위해 개발되었습니다.

 

-리듀스의 혁신적인 부분은 데이터 집합에 대한 쿼리를 입력 받아, 분할 한 후, 여러개의 노드에서 병렬로 처리하는데 있습니다. 이러한 분산 처리는 단일 장비에서 처리하기에는 부적합한 대규모 데이터 처리 문제를 해결합니다.

 

 [ 분산 환경에서의 Map-Reduce 실행 ]

 

위의 그림은 네임노드(NameNode)의 잡트랙커(JobTracker)가 데이터노드(DataNode)의 테스크트랙커(TaskTracker)에게 일을 분배해 주는 개념도입니다. 데이터노드는 컴퓨터 한대라고 생각하시면 되며, -리듀스 함수들은 컴퓨터 마다 상주하여 병렬로 작업을 수행함으로써 대규모 데이터를 짧은 시간안에 처리할 수 있습니다.

 

 

SMAQ (Storage, Map-Reduce and Query) 시스템

-리듀스가 널리 활용되기 시작하면서 스토리지(Storage), -리듀스(Map-Reduce), 쿼리(Query) 레이어로 구성된 빅데이터 시스템 스택(Stack)이 탄생하였습니다. SMAQ 시스템은 오픈소스로 일반 범용 하드웨어에서 분산 운용되는 것을 특징으로 합니다.

  

[ SMAQ 시스템 ]

 


리눅스(Linux), 아파치(Apache), MySQL, PHP 레이어로 구성된 범용 LAMP(Linux, Apache, MySQL, PHP) 스택이 웹 애플리케이션의 지평을 바꾸어 놓은 것과 마찬가지로 SMAQ 시스템은 빅데이터 처리의 지평을 확대하는데 큰 역할을 하고 있으며, 데이터 중심의 제품 및 서비스의 새로운 시대를 선도할 것입니다.

 

 

-리듀스(Map-Reduce)의 개념

-리듀스는 맵 단계와 리듀스 단계로 처리 과정을 나누어 작업합니다. (map)은 흩어져 있는 데이터를 관련 있는 데이터끼리 묶는 작업을 통해서 임시 데이터 집합으로 변형되며, 리듀스(Reduce)는 맵 작업에서 생성된 임시 데이터 집합에서 중복 데이터를 제거하고 원하는 데이터를 추출하는 작업을 진행합니다.

 

 

  

[ Map-Reduce 작업 ]

 

 -리듀스 처리 순서

맵리듀스가 분산, 병렬 처리하기 좋은 이유는 입력 데이터에 대한 맵 함수는 동시에 독립적으로 병렬 처리할 수 있는 구조이기 때문입니다. 다음 그림을 통해서 맵-리듀스 작업 순서에 대해서 알아보겠습니다.

  

[ -리듀스 처리 방법 ]

 

 

 분할(Splitting)

입력 파일의 값을 라인 단위로 분할합니다.

 

 매핑(Mapping)

분할된 라인 단위 문장을 맵(Map) 함수로 전달하면, 맵 함수는 공백을 기준으로 문자를 분리한 후에 단어의 개수를 계산합니다. 맵 함수를 거치면서 임시 데이터 결과가 메모리에 저장됩니다.


 셔플링(Shuffling)

메모리에 저장되어 있는 맵 함수의 출력 데이터를 파티셔닝과 정렬을 해서 로컬 디스크에 저장한 후에 네트워크를 통해 리듀서의 입력 데이터로 전달합니다.


 리듀싱(Reducing)

리듀스(Reduce) 함수는 단어 목록들을 반복 수행하면서 합을 계산하여 표시합니다.

 

 

-리듀스의 문제점

최근까지 하둡은 HDFS의 대규모 데이터를 처리하는 계층으로 맵-리듀스를 선택했습니다. 하지만 최근 소개된 차세대 하둡으로 알려진 얀(YARN, Yet Another Resource Negotiator)은 하둡 환경의 맵-리듀스에 대한 의존성을 제거하였습니다.

이러한 변화에는 맵-리듀스가 가지고 있는 확장성 문제와 처리 속도가 느리다는 제약사항 때문입니다. -리듀스의 이러한 한계로 인하여 많은 개발업체들이 속도 향상를 위하여 다른 방법을 생각하도록 유도하였습니다. ( 예를 들면 IBM의 어댑티브 맵-리듀스(Adaptive Map-Reduce)을 들수 있다.)

  

[ 하둡 2.0 스택 ]

 

위의 그림을 보시면 하둡 2.0에서는 클러스터 리소스 관리(Cluster Resoruce Management)를 맵-리듀스 대신에 얀(YARN)이 담당하고 있습니다. 얀은 기존의 맵-리듀스 API와의 호환성을 유지하면서도 타 회사에서 개발된 다양한 도구에서도 실행될 수 있도록 확장성을 부여하였습니다. 이를 통해서 속도가 느린 맵-리듀스의 단점을 해결할 수 있는 기반을 마련한 것입니다.


posted by 권오성의 Biomedical Engineering 2014. 8. 22. 00:26

㉠ 위험관리과정5단계
위험관리전략 및 계획수립 1단계, 위험분석 2단계, 위험평가 3단계, 정보보호대책수립 4단계, 정보보호 계획수립 5단계

㉡ 정보보호의 목표와 특징

ⓐ 기밀성(Confidentiality) : 비인가된 개인, 단체, 프로세스 등으로부터 중요한 정보를 보호하는 것이다. 정당한 사용자에게만 접근을 허용함으로써 정보의 안전을 보장하는 것이라 하겠다. 기밀성은 꼭 필요하지만 무결성이 필요하지 않는 것은 로그인하여 개인정보를 수정하는 것이 적용사례가 되겠다. 기밀성의 위협요소로는 도청, 사회공학적 기법, 도난 등이 있다.

ⓑ 무결성(Integrity) : 정보의 저장과 전달시에 비인가된 방식으로 정보와 소프트웨어가 변경되지 않도록 정확성과 안정성을 확보하는 것이다. 즉, 정보의 내용이 변경되거나 파괴되지 않음을 보장하는 것이다. 메신저에서 간단한 친구의 정보는 볼 수 있지만 정보를 수정할 수는 없는 것이 무결성 사례라 하겠다.

ⓒ 가용성(Availability) : 인가된 사용자가 정보나 서비스를 요구할 때 언제든지 즉시 사용가능 하도록 제공하는 것이다.특히 디도스(Ddos)는 이러한 가용성을 방해함으로써 서비스에 방해를 하는 공격으로 가용성을 침해하는 공격이다.

ⓓ 인증(Authentication) : 인증은 정보주체가 본인이 맞는지를 인정하기 위해 사용하는 방법들을 말한다.

ⓔ 부인방지(Non-repudiation) : 부인방지라는 말은 메시지의 송수신이나 교환후에 그 사실을 증명함으로써 사실 부인을 방지하는 기술을 이야기한다. 즉, 이메일을 송신하고도 송신하지 않았다고 주장하는 송신자의 부인을 방지하거나 수신하고도 수신하지 않았다고 주장하는 수신자의 부인을 방지하는 기술을 말한다.

 

posted by 권오성의 Biomedical Engineering 2014. 8. 13. 21:01

플랫폼(Platform)이란?

 

플랫폼 전성시대라는 말을 들어보셨나요?! 플랫폼이라는 용어는 IT업계에서 뿐만 아니라 각종 신문기사나 뉴스에서 많이 보셨을 거라고 생각되는데요! 그렇다면 소프트웨어 업계에서 플랫폼이란 어떻게 정의할 수 있으며, 그 영향력은 어떨까요? 금번 포스팅에서는 플랫폼에 대해 알아보고자 합니다-!

 

<플랫폼(Platform)이란?>

 

플랫폼(Platform)Plat(평평한 땅, 라틴어 어원 : plate) form(형태, 라틴어 어원 : forme)가 합쳐진 말로 단상, 무대 혹은 기차역에서 사람들이 타고 내리기 위한 평평한 땅을 일컫는 말입니다.

 즉, 일반적으로는 (뉴스 기사 등에서 많이 보시는 용어는) 어떠한 기반이 되는 장() 혹은 기초가 되는 틀/규격 등을 말합니다. 핸디소프트 등의 IT 업계에서 말하는 플랫폼도 이와 같은 맥락입니다 

 

* Computing platform

          : a framework on which applications may be run

           ​[ 출처 : 영문 위키디피아 발췌, http://en.wikipedia.org/wiki/Platform ]

 

  

 위의 영어 표현을 보시면 명확히 와 닿을 거라고 생각하는 데요- 가장 쉬운 예로 Windows 운영체제를 들 수 있습니다. Windows 위에서 각종 프로그램들이 작동할 수 있습니다. 또 다른 예로는 모바일 플랫폼으로 불리는 애플의 iOS와 구글의 Android OS와 소셜네트워크 서비스(SNS)인 페이스북도 플랫폼이라고 할 수 있습니다.

 그렇다면, 이쯤에서,


<왜 플랫폼을 주목하는가?>


플랫폼 전성시대’, ‘플랫폼 전쟁등 플랫폼은 막강한 영향력을 갖는다고 평가받고 있는데요. 그 이유는 무엇일까요? 前 구글 CEO였던 에릭 슈미트는 구글, 애플, 페이스북 그리고 아마존 이들이 IT 세계를 지배할 수 있는 것은 플랫폼을 기반으로 하고 있기 때문이다.” 라고 말했습니다. 실제로 모바일 운영체제 세계 시장 점유율에서 90% 이상의 독점적 위치를 애플(iOS)과 구글(Android)이 차지한 것을 플랫폼 때문이라고 볼 수 있습니다 

플랫폼과 함께 등장하는 용어는 생태계인데요. 애플의 예로 풀어보겠습니다.

애플 생태계를 살펴보자면, 아이튠즈와 앱스토어와 같은 구조를 통해서 앱의 생산자와 구매자가 만나게 되며, 거래가 이루어질 때 애플은 수수료에 대한 수익을 얻게 됩니다. 그런데 애플기기를 사용하는 유저는 아이튠즈와 앱스토어로만 동기화가 가능하기에 애플 유저라면 계속 사용할 수 밖에 없는 구조가 됩니다. 



비슷한 구조로 구글은구글 플레이’, 마이크로소프트는윈도 스토어마켓을 운영하고 있습니다.

이제 이해가 가시나요? 이렇듯 이미 우리가 사용하는 스마트폰이 플랫폼의 영향력 아래 있습니다. 애플의 예에서 보듯 울타리 격인 플랫폼의 중요성이 크기에, 비단 모바일 뿐만 아니라 사용자들을 한 울타리(플랫폼)에서 머물게 하려는 플랫폼 전쟁이 계속 진행되고 있으며, 그 중요성은 더욱 커질 것으로 예상되고 있습니다.  

posted by 권오성의 Biomedical Engineering 2014. 8. 13. 20:47

 SaaS, PaaS, IaaS ?!  

SaaS란 무엇일까요?! 들어본 적이 없으신 분들도 있을 테고, 클라우드와 IT에 관심이 있는 분들 중에서도 정확한 개념을 알고 싶으신 분들을 위해! SaaS, PaaS, IaaS의 개념과 차이점에 대해서 알아보고자 합니다-!! 

먼저, 클라우드에 대해서 짚고 넘어가겠습니다. 

 <클라우드? 클라우드 컴퓨팅?>

 

 

 

클라우드가 뭐예요?

- “ 클라우드 컴퓨팅(cloud computing)은 인터넷 기반(cloud)의 컴퓨팅(computing) 기술을 의미한다. 인터넷 상의 유틸리티 데이터 서버에 프로그램을 두고 그때 그때 컴퓨터나 휴대폰 등에 불러와서 사용하는 웹에 기반한 소프트웨어 서비스이다.” [위키백과 발췌]

- 위와 같이, 많은 분들이 스마트폰과 통신사와 포탈에서 제공하는 서비스로 접하셨던 그 클라우드가 맞습니다. 쉽게 말해, 컴퓨터나 스마트폰 같은 기기들에서는 일시적으로 정보를 보관/사용하고, 정보의 저장, 관리 등은 클라우드라는 다른 공간에서 이루어지는 개념입니다. 현재는 대체로 클라우드 컴퓨팅이라는 용어가 간단하게 클라우드로 사용되고 있습니다.

  

∙ 근데, 왜 클라우드예요?

- 인터넷을 구름 모양의 다이어그램으로 표현하는 것에서 클라우드라는 이름이 유래되었다고 합니다. 클라우드가 구름처럼 무형의 제3의 공간이라는 면에서 참 어울리는 것 같습니다.

- 높은 효율성과 비용 절감의 이점으로 많은 IT 관련 기업 및 연구기관에서 클라우드 컴퓨팅을 매년 주요 IT 이슈로 전망하고 있습니다. 하지만, 정보가 모두 저장된 서버가 공격 당하면 모든 정보가 유출될 가능성이 있다거나, 아직까지 우려되고 고려해야 할 점들도 많이 있습니다.

 

 <SaaS, PaaS, IaaS>

∙ 클라우드 컴퓨팅은 전달하는 서비스 형태가 어떤 것이냐에 따라 SaaS, PaaS, IaaS로 분류합니다.

SaaS (Software as a Service)

- SaaS (Software as a Service)는 소프트웨어를 설치하는 것이 아니라 서비스 형태로 제공하는 것입니다. 가장 대표적인 것이 온라인 오피스 소프트웨어인 구글의 문서도구(Docs)가 있으며, 이밖에 메일과 웹하드 서비스도 SaaS라고 할 수 있습니다.

 

PaaS (Platform as a Service)

- 어플리케이션이나 서비스가 실행되는 환경을 제공하는 것입니다. SaaS의 개념을 개발 플랫폼에 확장한 방식으로 볼 수 있습니다. 대표적으로 구글 앱엔진을 들 수 있습니다.

 

IaaS (Infrastructure as a Service)

서- 버, 스토리지, 데이터 베이스 등과 같은 시스템이나 서비스를 구축하는데 필요한 IT 자원을 서비스 형태로 제공하는 것입니다. 아마존의 AWS EC3, S3 등의 서비스 IaaS라고 볼 수 있습니다.

posted by 권오성의 Biomedical Engineering 2014. 8. 13. 20:31
3)서브넷 마스크(Subnetmask)
-서브넷 마스크는 간단히 말해서 빠르게 전파되는
인터넷 떄문에 IP주소의 문제를 적절하게 해결하
고 네트워크를 구분 또는 분류 하기 위해서 IP주
소의 범위를 나누는 기능.
-Subnetmask - Wildcardmask

Default Subnetmask

-A클래스:255.0.0.0
-2진법 : 11111111.00000000.00000000.00000000
-8비트의 서브넷 마스크
-B클래스:255.255.0.0
-2진법 : 11111111.11111111.00000000.00000000
-16비트의 서브넷 마스크
-C클래스:255.255.255.0
-2진법 : 11111111.11111111.11111111.00000000
-24비트의 서브넷 마스크

Ex)172.17.88.9 : B클래스대역 사설IP
   -사용되는 서브넷 마스크? 255.255.0.0

Ex)211.204.72.10 : C클래스대역 공인IP
   -사용되는 서브넷 마스크? 255.255.255.0

*서브넷 마스크에 포함되는 IP주소대역은 하나의
네트워크로 형성한다.

4)서브넷 마스크의 네트워크범위

Ex)
192.168.10.3
255.255.255.0
-------------AND연산 = 2진법

AND연산 - 1:참True / 0:거짓False
둘중에 한개만 거짓 : 거짓(0)
둘중에 한개만 참   : 거짓(0)
둘다 참            : 참(1)
둘다 거짓          : 거짓(0)

192.168.10.3
255.255.255.0
-------------AND연산
11000000.10101000.00001010.00000011
11111111.11111111.11111111.[00000000]IP 갯수
-----------------------------------AND연산
11000000.10101000.00001010.00000000

192.168.10.0/24
=>NetID : IP주소대역이 시작되는 초기주소.
=>IP갯수 : 2^8(8bit) = 256개(0-255)
=>192.168.10.0 - 192.168.10.255
=>Subnetmask Default는 기본적으로 1개의 네트워크
  를 갖는다.

-192.168.20.30/24 192.168.20.0 - 192.168.20.255
-192.168.21.31/24 192.168.21.0 - 192.168.21.255

tracert www.cisco.com  

 
문제
211.204.72.10
255.255.255.192
---------------AND연산
NetID? 211.204.72.0

211.204.72.88
255.255.255.224
---------------AND연산
NetID? 211.204.72.64

211.204.72.144
255.255.255.240
---------------AND연산
NetID? 211.204.72.144

Ex)
192.168.100.20
255.255.255.0
--------------AND연산
192.168.100.0[NetID]

192.168.100.20
11000000.10101000.01100100.00010100

255.255.255.0
11111111.11111111.11111111.[00000000]IP갯수
=>2^8 = 256
=>192.168.100.0 - 192.168.100.255

*전체비트 - Subnet Bit = Host Bit*

문제1)
=>255.255.255.128[25bit]
11111111.11111111.11111111.1[0000000]IP갯수
=>IP갯수=Host갯수=Client갯수=Node갯수
32bit-서브넷비트(25bit) = IP bit(7bit)
2^7=128개

문제2)
=>255.255.255.192[26bit]
11111111.11111111.11111111.11[000000]IP갯수
32bit-서브넷비트(26bit) = IP bit(6bit)
2^6=64개

문제3)
=>255.255.255.224[27bit]
11111111.11111111.11111111.111[00000]IP갯수
21bit - 27bit = 5bit
2^5=32개

문제4)
255.255.255.240[28bit]
11111111.11111111.11111111.1111[0000]IP갯수
32bit - 28bit = 4bit
2^4=16개

문제5)
=>255.255.255.248[29bit]
11111111.11111111.11111111.11111[000]IP갯수
32bit - 29bit = 3bit
2^3=8

문제6)
=>255.255.255.252[30bit]
11111111.11111111.11111111.111111[00]IP갯수
32bit - 30bit = 2bit
2^2=4개

문제7)
192.168.30.30/28

192.168.30.30
192.168.30. 00011110
255.255.255.11110000
--------------------AND연산
192.168.30.00010000[16]
-NetID? 192.168.30.16
-IP갯수? 32bit - 28bit = 4bit(2^4=16개)
-IP대역? 192.168.30.16 - 192.168.30.31

문제8)
192.168.125.100/29
-NetID
-IP갯수?
-IP대역

문제9)
211.204.72.130/26
-NetID
-IP갯수?
-IP대역

문제10)
211.204.31.100/23
32bit - 23bit = 9bit = 2^9 = 512개
-NetID? 211.204.30.0
-IP갯수? 9bit = 2^9 = 512개
-IP대역? 211.204.30.0 - 211.204.30.255
  211.204.31.0 - 211.204.31.255

문제11)
211.204.72.140/31
-NetID? 211.204.72.140
-IP갯수? 2^1 = 2
-IP대역? 211.204.72.140 - 211.204.72.141

문제12)
211.204.72.247/21
211.204.01001000.11101101
255.255.11111000.00000000
-------------------------AND연산
211.204.72.0
-NetID? 211.204.72.0
-IP갯수? 32 - 21 = 11bit = 2^11 = 2048개
-IP대역? 211.204.72.0 - 211.204.72.255
  211.204.73.0 - 211.204.73.255
  211.204.74.0 - 211.204.74.255
  211.204.75.0 - 211.204.75.255
  211.204.76.0 - 211.204.76.255
  211.204.77.0 - 211.204.77.255
  211.204.78.0 - 211.204.78.255
  211.204.79.0 - 211.204.79.255

문제13)
211.204.72.181/27

문제14)
211.204.72.91/30

문제15)
211.204.72.100/22

------------------------------------------------
4)게이트웨이(Gateway)
:서로 다른 통신망을 사용하는 장비 또는 장치끼리
서로 연결하여 통신이 가능토록 하는 기능.

Ex)0.100.20.25(x)
  10.3.33.0(x)

1. 211.204.72.0/24 NetID
  211.204.72.0 - 211.204.72.255 IP대역
   DG:211.204.72.1
---------------------------------------
2. 211.204.73.0/24 NetID
  211.204.73.0 - 211.204.73.255 IP대역
   DG:211.204.73.1

tracert www.ciscco.com

Ex)
192.168.0.0
255.255.255.0
--------------AND연산
192.168.0.0
255.255.255.0
=>=>11111111.11111111.11111111.[00000000]
=>2^8=>256개 IP(0-255)
=>2^n - 2 : 실제 가용 IP
=>2^8 - 2 : 254개(1-254)
=>192.168.0.1 - 192.168.0.254
=>Gateway : 192.168.0.1 / 192.168.0.254

Ex)
192.168.22.0/24 - 192.168.22.255/24 IP대역
=>NetID 192.168.22.0
=>2^8 : 0 - 255
=>2^n - 2 : 254 [0] - [255] 1 - 254
=>192.168.22.255[Broadcast]

브로드캐스트(Broadcast)


-Local LAN상에 붙어 있는 모든 네트워크 장비들에
게 보내는 통신 (전체통신)
-라우터로 인해 구분되어 지는 Broadcast Domain 안
에서의 전체 통신이다.
-자신이 받기 싫다고 해서 받지 않는것이 아닌 무조
건 받는 형태
-브로드캐스트의 주소
-논리IP:255
-물리MAC:FFFF.FFFF.FFFF
-통신시 IP주소가 아닌 MAC(물리주소)를 알아야 통
신이 되는데 상대의 MAC주소를 모르기 때문에 브
로드캐스트로 전체통신을 시켜 특정 IP주소를 묻
게되고 그중 해당 IP를 가진 유저에게 응답을 해
줄때 자신의 MAC까지 같이 보내주게 되어 통신을
할 수 있게 한다.
-모든 PC 가 CPU에 인터럽트를 걸기 때문에 PC성능
이 떨어진다.(Traffic현상)

ARP / RARP

arp -a

유니캐스트(Unicast)

 






-현재 네트워크상에서 가장 많이 사용하는 Traffic
-LAN에서 통신한다고 할때 전송되는 Frame안에
출발지PC의 MAC과 받는 목적지의 MAC이 들어있다.
-자신과 등록되어진 MAC주소 이외에서 온 데이터는
모두 필터링 한다.
-데이터 전송의 100% 안정성을 보장한다.

멀티캐스트(Muticast): Public IP [224.0.0.0]
-특정 그룹에게 데이터를 보내는 경우 아주 적합한
방법
-브로드캐스트와 유니캐스트의 장점을 살린 기능.
-멀티캐스트를 장비에서 지원해야지만 동작하는 단
점.

IP 계산의 응용

-서브넷 마스크(Subnetmask)
=>255.0.0.0
=>255.255.0.0
=>255.255.255.0

-와일드카드 마스크(Wildcard Mask)
=>255.255.255.0 => 0.0.0.255
=>255.255.0.0 => 0.0.255.255
=>255.0.0.0  => 0.255.255.255
=>255.255.248.0 => 0.0.7.255
=>255.255.255.252 => 0.0.0.3

Ex)Subnet 21bit
=>Wildcardmask => 255.255.248.0 => 0.0.7.255
Ex)Subnet 27bit
=>Wildcardmask => 255.255.255.224 => 0.0.0.31
Ex)Subnet 14bit
=>Wildcardmask => 255.252.0.0 => 0.3.255.255

와일드카드 마스크(Wildcard Mask)
=>와일드카드 마스크는 서브넷 마스크와 유사한 기
  능으로 호스트와 네트워크를 구분
=>네트워크를 제어하거나 정보통신용 프로토콜에 사
  용되는 모든 통신 기반에 필터링에도 사용.
=>보안기능에 적절하게 사용.

------------------------------------------------

서브넷팅(Subneting)
-IP의 낭비를 개선 또는 방지하기위해 네트워크를
분리하는 기능.
-기존에 가지고 있던 서브넷 마스크의 Bit를 변화
시켜서 호스트의 갯수를 감소시키는 기능을 포함
-서브넷 마스크의 Bit를 증가
  -네트워크 갯수(증가) IP갯수(감소)

Ex)
192.168.10.0[NetID]
255.255.255.0
--------------------각각의 IP클래스별로 가질수
                    있는 기본 서브넷 마스크는 네
                    트워크가 1개이다.
255.255.255.0
11111111.11111111.11111111.[00000000] 2^8=256개

Ex)211.204.72.0/24
=>A회사에서 사용중인 PC 25대(공인IP 25개)
=>서브넷팅을 통해서 낭비를 최소화 할 수 있는 방
  법은?
211.204.72.0/24

211.204.72.0 - 211.204.72.255
-----------------------------1개의 네트워크
11111111.11111111.11111111.00000000 =>24bit
11111111.11111111.11111111.[111][00000]
=>255.255.255.224=>27bit
IP갯수:2^5=>32개
네트워크 갯수:3bit =>2^3=8개

0-31 0,31 1-30
-------
32-63  32,63 33-62
-------
64-95 64,95 65-94
-------
96-127
-------
128-159
-------
160-191
-------
192-223
-------
224-255 224,255 225-254

Ex)211.204.72.0/24
=>A회사 PC 13개 => 공인IP
=>서브넷팅으로 낭비를 최소화 할 수 있는방법?
=>255.255.255.0
=>전체bit-호스트bit=서브넷bit
=>32bit-4bit=28bit= 255.255.255.240
11111111.11111111.11111111.00000000
11111111.11111111.11111111.[1111][0000]
네트워크갯수:2^4=16
호스트갯수:2^4=16

0-15 1,15 1-14
16-31 16,31 17-30
32-47
48-63
64-79
80-95
96-111
112-127
128-143
144-159
160-175
176-191
192-207
208-223
224-239
240-255 240,255 241-254

문제1)C클래스계열의 IP 192.168.10.0 - 255
      사용자IP:61개    255.255.255.0
=>서브넷팅?
=>전체bit-호스트bit=서브넷bit
  32bit-6bit=26bit 255.255.255.11000000
=>255.255.255.192 => 0.0.0.63
  =>11111111.11111111.11111111.[11][000000]
=>서브넷갯수:2bit증가=2^2=4개
=>호스트갯수:6bit감소=2^6=64개
0-63 0,63 1-62
64-127 64,127 650126
128-191 128,191 129-190
192-255 192,255 193,254

문제2)C클래스계열의 IP 192.168.10.0 - 255
      사용자IP:2개     255.255.255.0
=>서브넷팅?
=>32bit-2bit=30bit 255.255.255.252
  11111111.11111111.11111111.[111111][00]

=>서브넷갯수:6bit 2^6=64 Subnet=Network
=>호스갯수:2bit 2^2=4 Host=Node

0-3 0,3 1-2
4-7 4,7 5-6
8-11 8,11 9-10
.
.
.
252-255 252,255 253-254


*공식*
-2^n -2
-전체bit-호스트bit=서브넷bit
-전체bit-서브넷bit=호스트bit




문제3)
어느회사 A회사의 공인IP가 210.100.1.0인 네트워크
를 ISP로부터 IP를 할당 받았다.A사의 건물은 8층으
로 이우어져 있으며, 각 층마다 부서가 분리되어 있
다.그러므로 각 층마다 네트워크를 달리 했으면한다.각 층별로 컴퓨터 30대를 놓으려면 서브넷 마스크는 어떻게 분리하여 IP네트워크를 설계하는가?
32bit-5bit=27bit 255.255.255.224

문제4)
A회사에서 C클래스 네트워크를 24개의 네트워크로
분리시키고자 한다.IP는 ISP로부터211.204.72.0/24 배정받았다. 엔지니어가 할 수 있는 적절한 서브넷 마스크는 어떤것 인가?
24bit+5bit =29bit 255.255.255.248

문제5)
우리은행에서는 현재 C클래스의 IP대역을 사용중이며, 192.168.30.0/26를 현재 운용중이다. 현재 사용중인 대역은 몇개의 네트워크로 분리되어 있는가?
32bit-26bit = 64개
255.255.255.[11][000000]
255.255.255.192

 

posted by 권오성의 Biomedical Engineering 2014. 8. 13. 19:58

빅데이터란 과연 무엇인가? 기존 데이터에 비해 방대하게 커진 데이터를 말한다.

하둡 프로그래밍(Hadoop Programming)은 빅데이터 시스템중 하나로 빅데이터의 기술 처리를 위해 태어난 분산파일시스템이다. 하둡은 분산파일 시스템과, 맵리듀스(mapreduce)로 구성되어있다.

하이브(hive)는 하둡프로그램을 쉽게 처리하기 위한 솔루션이다. 또한 데이터베이스들을 담고 있는 윈도 레지스트리(Windows Registry)에서 가장 높은 수준의 조직을 일컫기도 한다. 하이브는 하둡을 데이터웨어하우스(DW)로 운영할 수 있게 해주며, 수많은 레지스트리의 논리를 구분할 때 사용할 수 있다는 강점이 있다.

R프로그래밍은 통계학 정보를 처리하는 분석 과정이며, 통계 계산과 그래픽을 위한 프로그램 언어이자 소프트웨어 환경이다. R은 기타 유료 통계시스템인 SAS, SPSS와 비교해도 성능면에서 큰 차이가 안 나 요즈음 새롭게 떠오르는 프로그래밍 방식이다.

posted by 권오성의 Biomedical Engineering 2014. 7. 7. 22:24

레이어별 네트워크 장비

 계층

 장비

설명 

 상위계층

 응용계층

게이트웨이

(Gateway) 

분산정보 서비스 제공 

 표현계층

암호화, 암축, 코드변환, 구문검색 

 세션계층

통신장치간 상호작용, 동기화, 전송방향 

 전송계층

종단간 연결 설정/해제,  다중화, 집중화, 주소지정

 하위계층

 네트워크계층

라우터(Router) 

패킷정보전송, 교환기능, 경로선택, 트래픽제어 

 데이터링크계층

브리지(Bridge) 

오류제어, 흐름제어, 프레임동기,링크효율향상 

물리계층 

리피터(Repeter) 

전기적, 기계적, 기능적, 절차적인 물리적특성 


TCP/IP 프로토콜과 OSI 7레이어

 OSI 7

Layer Model

 TCP/IP Layer

 TCP / IP의 구현

 응용계층

 Application

 FTP

 표현계층

 TELNET

 세션계층

 SMTP, DNS , TFTP, SNMP

 전송계층

 Transport

 TCP, UDP

 네트워크계층

 Internet

 IP / ICMP / ARP / IGMP

 데이터링크계층

Network
Access

 Ethernet / Token Ring / FDDI

 물리계층


posted by 권오성의 Biomedical Engineering 2014. 7. 5. 19:13

* 대칭암호

* 공개키암호

* 일방향 해시 함수

* 메시지 인증코드

* 디지털 서명

* 의사난수 생성기