JavaScriptをがんばるブログ

React,OSS,ソフトウェア開発が中心のブログです👨‍💻

2016-12-01から1ヶ月間の記事一覧

ストップワードという概念を知りました

あまりにも頻出するので検索対象から除外する言葉、という意味の単語です。 ストップワードとは - はてなキーワード 当初この概念を知らず、kuromojiで形態素解析したワードのリストから「だから」「でも」などの慣用句を除外する方法としてTF-IDFという手法…

Packer + Docker + Ansibleでハマる

Packer + Ansible + Dockerの組み合わせは茨の道 Scalaが動くDockerコンテナを作りたくてトライしてみました。 rebuild.fm 167でもDockerfileを使いたくないという話がポロっと出ていましたが、 rebuild.fm 私もインフラのセットアップは愛用しているAnsible…

【開発日記】日本語アカウントのツイート内で1分当たりのトップワードを集計

「つぶやきビッグデータのようなもの」開発日記です(`・ω・´)” ただの日記なので技術情報を求めて検索して来られた方には申し訳ない(;_・) 一応この記事を参考にやってます。 Apache Sparkで始めるお手軽リアルタイムウインドウ集計 | NTTデータ先端技術…

packerでdockerイメージbuild中にaptエラー

技術メモです。 環境 docker 1.12.3 packer 0.10.0 OSX 10.11.6 packer設定ファイル // packer.json { "variables": { "docker_image": "ubuntu" }, "builders": [{ "type": "docker", "image": "{{user `docker_image`}}", "commit": "true" }], "provision…

"週間はてなブログ"という有能サイト

今日は東京もとても寒かったですね。昨日天気を調べたら-3℃という数字が出てきてビクッとしたのですが予想通りの寒さでした。 それにこのようなリア充な風景が組み合わさるともはや北海道に居るんじゃないかという感覚になります。個人的に冬の寒さ+イルミネ…

つぶやきビッグデータのようなもの

久しぶりの更新、前回までは数学の勉強履歴を書き残しておりましたが、内容が難しくなって来たので更新が億劫になり(^_^;)一応チマチマと勉強を続けており、「データの分析」章で理解した事をまとめた記事を書いている最中です。 今は三角比を勉強しています…