TIRIS – Big Data Analytics for Intelligent Decisions – Thales

신뢰할 수있는 운송에 대한 요구는 끊임없이 증가하고 있습니다 철도는 향후 20 년 동안 40 %까지 성장할 것으로 예상됩니다

더 긴 운영 시간과 더 많은 승객을 제공합니다 대조적으로, 철도 운영자 및 유지 보수 담당자는 운영 및 유지 관리 비용을 통제하고 간소화하는 데 어려움을 겪고 있습니다 디지털화는 비용을 관리하고 수익을 최적화 할 수있는 기회입니다 연구 결과에 따르면 데이터 기반 의사 결정에 의존하는 회사는 매출을 최대 30 %까지 끌어 올릴 수 있습니다 철도 산업에서 데이터 기반 의사 결정의 가장 큰 기회 중 하나는 예측 유지 관리 및 운영 지원입니다

예측 유지 보수를 통해 유지 보수 담당자는 예기치 못한 서비스에 장애를 일으켜 계획된 시스템 종료로 이동할 수 있습니다 가용성을 높이고 유지 보수 비용을 줄입니다 또한 수리 관련 정보를 운영 팀에 쉽게 연결하여 사일로를 파기합니다 이를 통해 팀은 유지 보수 및 운영상의 요구 사항을 이해하여 수리를 수행하기위한 최적의 시간대를 찾을 수 있습니다 시간표 및 처벌에 대한 혼란을 최소화합니다 TIRIS는 운송 업계의 Thales 예측 유지 보수 및 운영 지원 도구입니다

그것은 물건의 산업 인터넷과 같은 기술을 활용, 클라우드 기반 솔루션 및 데이터 분석을 활용하여 크고 작은 데이터 소스로부터 얻은 뛰어난 통찰력과 지식을 제공합니다 이 밖에도 다양한 디지털 서비스가 제공됩니다 소프트웨어 개발 데이터 과학 자문 서비스 포함 TIRIS는 Thales의 세계적인 사이버 보안 경험에 기술 무신론자이며 안전합니다 최종 결과는 효율적인 운송입니다 행복한 승객은 정시에 목적지에 도착하지 않고 행복한화물 고객이 포장을 해체하고 철도 산업 효율적인 운송은 더 많은 비즈니스를 의미합니다

Getting Started with Oracle Big Data Discovery – Module 3: Load Data

오라클 빅 데이터 검색 시작하기에 다시 오신 것을 환영합니다 이 모듈 (3)이며, 데이터를로드

마지막으로 모듈에서 데이터를 찾고, 탐구, 변형, 발견하고 공유하는 오라클 빅 데이터 검색을 사용하는 방법에 대한 개요를 얻었다 이 모듈에서는, 당신은 당신이 그 모든 일을 할 수 있도록 데이터가 오라클 빅 데이터 검색에로드하는 방법에 대한 개요를 얻을 수 있습니다 오라클 빅 데이터 디스커버리 스튜디오, 그것을 변화시키고 풍부하게 발견하고 큰 데이터를 탐색, 신속하게 할 수있는 하나의 직관적이고 시각적 인 사용자 인터페이스 새로운 가치를 발견하고 공유 할 수있는 사람을 위해 빅 데이터의 잠금을 해제 Dgraph 게이트웨이는 업계를 선도하다 분석에 대한 관리 복잡한 데이터를 단순화 오라클 빅 데이터 검색의 핵심 데이터 검색 기술 마지막으로, 데이터 처리 계층은 고속 데이터 프로파일, 변환을 수행 하둡 스파크 성분을 이용하고, 농축

의 IT 사용자 또는 오라클 빅 데이터 검색 관리자의 명령 줄 인터페이스 스크립트입니다 오라클 빅 데이터 검색에 하이브 테이블에서 데이터를 섭취하는 실행합니다 CLI를 스크립트는 무작위로 샘플을 각 하이브 테이블 (기본 1 인 만 개 기록), 데이터 세트 스키마와 메타 데이터를 검색하고 데이터에 부화를 실행합니다 CLI를 스크립트는 처음에 제품 중에 실행 설치뿐만 아니라 CRON 작업을 설정하여 정기적으로 실행할 수 있습니다 결과 데이터 세트는 스튜디오의에 표시됩니다 목록 후드, 상기 데이터 세트는 dgraph에 저장되고 dgraph 게이트웨이에 의해 관리

이 데이터 인제 스트에 대한 자세한 내용 과정은 오라클 빅 데이터 검색 데이터 처리 안내서에서 찾을 수 있습니다 데이터도 비즈니스 사용자에 의해로드 할 수 있습니다 이 비즈니스 사용자가 Excel 또는 CSV 파일을 업로드 Studio에서 사용자 인터페이스를 사용합니다 스튜디오는 CSV 또는 XLS 파일을 사용하여 하이브 테이블을 생성하고 HDFS에 저장합니다 스튜디오는 데이터 처리 코드를 직접 호출을 차례로이기도 dgraph에서 설정 데이터를 생성 스튜디오의 카탈로그에 표시됩니다

두 경우 모두, 오라클 빅 데이터 디스커버리 분류, 유형을 추론, 데이터 프로파일 콘텐츠 및 이해 값 분포 또한 전체 데이터 세트를 풍요롭게 이것은, 추출 위치, 언어, 감정을 포함 용어는 등, 데이터 세트에서의 새로운 데이터로 저장 빠른 검색을 위해 준비 빅 데이터 디스커버리는 인덱스 데이터를하고, 분석 비즈니스 사용자의 데이터를 업로드, 그것은 스튜디오 내에서 수행됩니다

에 "+ 데이터 설정"버튼을 클릭 데이터 업로드 프로세스를 시작합니다 데이터 세트의 이름과 선택적으로 데이터 세트에 대한 설명을 입력합니다 그런 다음 파일 업로드를 클릭합니다 파일의 위치를 ​​찾은 다음 열기를 클릭합니다 이 데모를 위해, 나는 Excel 파일을 선택합니다

이 시스템은 데이터의 처음 25 개 행을 표시, 파일의 미리보기를 제공합니다 내 스프레드 시트는 하나 개의 워크 시트를 가지고 있지만, 경우 당신은 당신이 여기에 데이터 업로드에 사용할 하나를 선택할 수 있습니다, 하나 이상 가지고있다 한 번에 하나의 워크 시트를 업로드 할 수 있습니다 데이터가 헤더 행이있는 경우이 확인란을 선택합니다 내 데이터는 헤더 행이 있는가, 그래서 나는이 체크 떠날 것이다

이것은 오라클 빅 데이터를 수 검색 데이터의 첫 번째 행은 열 헤더로 사용 속성치하지됨을 안다 그런 다음 완료를 클릭합니다 새로운 데이터 세트입니다 자동 Studio의 카탈로그에 만들었습니다 당신은 오라클 빅 데이터 검색 내 탐색 창으로하게된다 여기에서 검토 할 수 있습니다 기록은

possibly 데이터를 변환 및 / 또는이 데이터 세트를 추가 샘플 및 해당 속성과 당신의 다음 단계에 대한 여부를 결정 프로젝트 이 스크린 캐스트에서는 데이터가 모두 IT에 의해 오라클 빅 데이터 검색에로드 할 수 있다는 것을 배웠습니다 사용자와 비즈니스 사용자

아무리 데이터를 HDFS에 들어간 방법, 오라클 빅 데이터 디스커버리는 자동으로 프로필이 존재하지 않습니다 그것을 분석하고, 인덱스 것 그것은 스튜디오에서 최종 사용자에 의해 사용 이것은 오라클 빅 데이터 검색을 시작으로 얻기위한 스크린 캐스트 시리즈를 마칩니다 에 대한 오라클 빅 데이터 디스커버리는 Oracle 도움말 센터 웹 사이트에서 찾을 수 있습니다 설명서 세트를 참조하시기 바랍니다 사용에 대한 자세한 내용은 또한 오라클 빅 데이터 검색 시작하기, 자기 학습 과정을 참조하십시오

Getting Started with Oracle Big Data Discovery – Module 2: Process Overview

오라클 빅 데이터 검색 시작하기에 다시 오신 것을 환영합니다 이 모듈 2, 프로세스 개요입니다

마지막 모듈에서, 당신은 중요한 비즈니스 인텔리전스에서 데이터 준비에 소요되는 시간을 줄일 수있는 방법을 찾는 것을 배웠다 프로젝트는 그래서 당신은 데이터 분석에 더 많은 시간을 보낼 수 있습니다 궁극적 목표는 해당 분석에서 발견 된 정보를 사용하는 것입니다 귀하의 비즈니스를 향상시킬 수 있습니다 이 모듈에서는 오라클 빅 데이터에서 따라 전체 프로세스에 대해 알아 보겠습니다 발견 당신이 그렇게 할 수 있도록 도와줍니다 우리가 이미 언급 한 것처럼, 빅 데이터에 내재 된 과제는 3 V의 위치 : 대형의 다양한 데이터, 들어오는 데이터의 증가 속도, 데이터의 매우 큰 볼륨 이러한 문제를 해결하기 위해, 데이터는 하둡에 저장됩니다

스마트 기업은 항상 자신의 장점에 데이터를 사용했다 그러나 지난 몇 년에 걸쳐 포괄적 인 용어에서 기술의 발전 "빅 데이터"는 흥미로운 새로운 가능성을 도입했습니다 있는 아파치 하둡 프로젝트 생성 된 데이터의 저장 기술 정형 및 비정형 다양한 데이터를 저장할 수있는 효율적인 확장 성, 신뢰성, 비용 또한, 계산 맵리 듀스와 불꽃 같은 프레임 워크는 분산 평가를 통해 많은 양의 데이터의 실제, 정교한 분석을 만들었습니다 기계 학습 및 통계 분석에 중요한 역할을 수행했다

그 결과 점점 더 많은 조직에 하둡에 의존하고 있습니다 비즈니스의 모든 구석에서 데이터를 수집하기 위해 중앙 집중식 데이터 저장소를 구축 할 수 있습니다 웹 로그에서 고객 리뷰에, 공급 업체 데이터에서에 소셜 미디어, 우리는이 새로운 데이터 저장 및 분석 기술이 새로운 도구를 필요로 믿습니다 오라클 빅 데이터 디스커버리는 조직 내 사용자의 계속 성장하는 설정을 돕기 위해 당신의 하둡 인프라에 내장되어 이 사는 데이터에 직접 참여 빅 데이터 검색을 사용하면 데이터가 당신이 수십하지 않을 경우의 카탈로그에서 분석에 필요한 설정 찾을 수 있습니다 데이터 세트의 수백 당신이 원하는 정보가 포함되어 있는지 확인을 탐험 해보세요

그리고 상호 작용을 사용하여 변환, 쉽게 사용하기 수단 당신이 혁신적인 방법으로 그들을 결합 분석을 수행 할 수있는 당신은 협력 프로젝트에 여러 데이터 세트로 작업 할 수 있습니다 궁극적으로 팀 구성원과 함께 중요한 통찰력을 발견 할 수 있습니다 ,의 한 번에 다음, 하나의 각을 통해 가자 좀 더 자세하게한다 먼저 오라클 빅 데이터 검색에 로그인 할 때 상상, 당신은 수많은에 액세스 할 수 있으며 다양한 데이터 세트 이러한 통해 검색하는 것은 매우 많은 시간이 소요될 수 있습니다

그럼 당신이 원하는 데이터를 찾는 방법으로 시작하자 홈 페이지에서 데이터 세트 및 사용 가능한 프로젝트의 수에 대한 요약을 볼 수 있습니다 그들은 아래 목록에 나열됩니다 의는 특정 데이터 세트를 찾는 데 집중하고 싶어요 가정 해 봅시다 당신은 검색 및 사용할 수를 사용할 수 있습니다 상세 검색은 화면에 표시된 선택 범위를 좁힐 수 있습니다

그런 다음 데이터 세트의 요약을 볼 수 있습니다 당신에게 특정 데이터 세트에 무엇의 더 나은 아이디어를 제공합니다 이 좋으면, 당신은 더 밀접하게 그것을 검사하는 탐색을 클릭합니다 사용자 인터페이스의 탐색 섹션은 특정 데이터 세트를 조사하기 위해 여러 가지 도구를 제공합니다 탐색은 기본적으로 만 기록까지, 샘플 크기의 레코드 수를 보여주는 요약 줄뿐만 아니라를 제공합니다 전체 데이터 세트의 레코드 또한 속성의 수를 표시합니다

이러한 특성의 각각은 시각화에 의해 표현된다 이하 이러한 시각화는 데이터 종류에 따라 데이터 값 분포 또는 '형태'을 표시한다 그리고 그들은으로 구성되어 있습니다 우선 먼저 가장 관심을 가질만한 것들 표시; 이러한 매우를하거나, 일상의 무언가를 포함하는 것과 같은 특이한 분포 그래서 지금 당장, 말 그대로 기록의 수백만의 상당수가 있더라도 속성은, 내 데이터의 가장 놀라운 비정상적인 부분에 초점을 맞출 수 있습니다 우리는 더 자세하게 통해 갈거야 과정을 e 러닝 자율 학습은 오라클 빅 데이터 검색 시작하기

나는 데이터를 탐구했고 식별 한 후 내가 원하는 데이터 세트는, 나는 데이터의 몇 가지 장애물을 인식 할 수있다 예를 들어, 아마도 월마트는 때때로으로 입력됩니다 월마트와 다른 경우는 월마트로 입력 아니면 내가 같은 속성에 두 개의 값이있을 수 있습니다, 나는이되기 위해 그들을 분리하는 것을 선호 개별 속성 이 같은 문제를 해결하기 위해, 데이터를 수정하는 변환을 사용합니다 클릭에 아이콘을 변환 열은 그 데이터 형식 변환 가능한 옵션의 메뉴를 표시 호

당신이 변화를 시작하려는 하나를 선택합니다 그런데, 모든 변환은 데이터의 사본에 수행됩니다 원시 데이터 자체가 변형되지 않습니다 그리고 변환을 적용하기 전에 결과를 미리, 심지어 변환을 롤백 할 수 있습니다 당신은 오라클 빅 데이터 검색 시작하기, 자기 학습 e 러닝 과정에서 변환에 대한 자세한 내용을 볼 수 있습니다

데이터를 변환 한 후, 당신은 지금 일부 세부적인 분석을 준비하고 향상시키는 데 사용할 수있는 정보를 발견하여 사업 이것은 프로젝트 내에서 수행된다 프로젝트 카탈로그가 홈 페이지에 표시 된 것을 기억하십시오 당신은 추가 할 수 있습니다 기존 프로젝트에 데이터를 변환하거나 새 프로젝트에 추가합니다 프로젝트는 상호 작용의 대시 보드 뷰를 제공 시각화

또한 친숙한 검색 도구와 안내 네비게이션을 포함, 그래서 당신은 데이터를 신속하게 조사를 시작할 수 있습니다 그냥 드래그 시각화 당신은 옵션 메뉴에서 원하는 및 대시 보드에 그들을 놓습니다 당신이 시작할 수 있도록 이들의 대부분은 미리 구성되어 있습니다 즉시 분석 당신은 그들이보고도 그 안에 데이터를 조사 할 수 있도록 다른 프로젝트에 대한 액세스를 제공 할 수 있습니다 당신은 오라클 빅 데이터 검색 시작하기, 자기 학습 e 러닝 과정에서 프로젝트에 대한 더 많은 것을 배울 수 있습니다

빅 데이터의 발견은 확실히 솔로 활동이 아니다 그래서 좀 더 자세히 공유를보고 약간의 시간이 소요될 수 있습니다 오라클 빅 데이터 디스커버리는 협력을 촉진하기 위해 설계되었습니다 이것은 다른 사람과 프로젝트를 공유함으로써 달성된다 당신은 공유 할 수 있습니다 책갈피 및 프로젝트 및 스냅 샷에서 특정 영역의 스냅 샷은 빅 데이터 이야기를 갤러리에 투입 될 수있다

이러한 공유 기능을 모두 팀으로 다른 사람과 공동 작업 및 반복 바랍니다 마지막으로, 당신은 또한 혼합을 게시하여 공유 할 수 있으며, 풍부한 데이터는 오라클 R과 같은 다른 도구의 활용을 위해 다시 HDFS로 설정 하둡, BI 툴, 돼지, 하이브 또는 오라클 빅 데이터 SQL과 같은 하둡 데이터에 사용할 수있는 다른 제품 오라클 빅 데이터 디스커버리 정말 빅 데이터 기술 생태계를 잘한다 요약하면, 첫 번째 단계는 찾기 그래서, 다음을 수행 할 수 있습니다 신속하게 데이터 세트 및 사용 가능한 프로젝트의 수를 참조하십시오 표시 결과를 좁힐 고급 정제 도구를 사용하여 단지이 시간에 당신에게 관련 있으며, 다음 세부 정보를 보려면 그 데이터 세트 및 프로젝트 당신이해야 어떤 항목을 결정하는 데 도움이 더 탐구

당신의 자동 강조하는 시각화를 사용하여 관심의 데이터 세트를 검사 할 수 있습니다 탐색 당신은 즉시 데이터에 대한 흥미로운 물건을 찾을 수 있도록, 가장 정밀 조사를받을 자격이 영역; 일 그 이전에 결코 할 수있다 그들은 데이터의 거대한 더미에 숨겨진 된 것이기 때문에 발견되었다 당신이 데이터를 직접 해결하기 위해 힘을 실어 변환 그래서 분석을위한 준비가되어 있습니다 당신은 당신이 알아서하는 기술 전문가에 기다릴 필요가 없습니다 그리고 발견은 프로젝트의 범위 내에서 하나 개 이상의 데이터 세트를 조사 할 수 있습니다 뿐만 아니라, 고급 검색 및 상세 검색 도구를 사용하여 대화 형 시각화, 당신은 발견하고 데이터에서 발견 된 중요한 통찰력을 공유 할 수 있습니다

이것은을 촉진, 자주 반복적 인 과정이다 그래서 비즈니스 사용자, 분석가, 통계, 데이터 과학자, 사이 공유 및 공동 작업 그리고 하나 개의 발견은 종종 리드 곳 다음에 자가 학습 e 러닝 과정은 더로 전환됩니다 오라클 빅 데이터 검색 시작하기 오라클 빅 데이터 검색의이 다섯 개 가지 주요 영역의 세부 사항 다음 모듈은 모듈 3, 데이터를로드합니다